我正在尝试从(随机)维基百科条目中获取纬度和经度。
wiki_coordinates(website)
coordinates = website.xml.find('.//*[@id="coordinates"]/')
这里是HTML来自https://en.wikipedia.org/wiki/Seattle(纬度和经度)
HTML有两个“有趣的”部分
<span class="latitude">47°36′35″N</span> <span class="longitude">122°19′59″W</span>
和
<span class="geo-dec" title="...">47.60972°N 122.33306°W</span>
问题是每个维基百科条目都有不同的xpath(或缺少)。
例如:
XPath = ".//*[@id="coordinates"]/span/span/a/span[1]/span"
XPath = ".//*[@id="coordinates"]/span/a/span[3]/span[1]"
谢谢!
coordinates = website.xml.find('.//*[@class="geo-dec"]').text
或
latitude = website.xml.find('.//*[@class="latitude"]').text longitude = website.xml.find('.//*[@class="longitude"]').text
希望这会有所帮助! :)
//span[@id="coordinates"]//span[@class="geo-dec"]//text()