使用XML XPATHS的Wikipedia LATITUDE和LONGITUDE（在Python中）

Question

我正在尝试从（随机）维基百科条目中获取纬度和经度。

wiki_coordinates(website)
coordinates = website.xml.find('.//*[@id="coordinates"]/')

这里是HTML来自https://en.wikipedia.org/wiki/Seattle（纬度和经度）

HTML有两个“有趣的”部分

<span class="latitude">47°36′35″N</span> <span class="longitude">122°19′59″W</span>

和

<span class="geo-dec" title="...">47.60972°N 122.33306°W</span>

问题是每个维基百科条目都有不同的xpath（或缺少）。

例如：

XPath =  ".//*[@id="coordinates"]/span/span/a/span[1]/span"
XPath = ".//*[@id="coordinates"]/span/a/span[3]/span[1]"

谢谢！

Answer 1

如果您想直接（从Wikipedia的顶部对LATITUDE和LONGITUDE进行索引，则有两种方法。

coordinates = website.xml.find('.//*[@class="geo-dec"]').text

或latitude = website.xml.find('.//*[@class="latitude"]').text
longitude = website.xml.find('.//*[@class="longitude"]').text

希望这会有所帮助！ ：）

Answer 2

尝试使用此xpath表达式，看看它是否适用于这些页面：

//span[@id="coordinates"]//span[@class="geo-dec"]//text()