你好R的狂热分子......
我一直在使用R从各种网站上抓取数据一段时间,但是这个让我感到难过。
我试图从下表中删除数据:http://www.vigimeteo.com/PREV/obs/obs_seul.html?a=07005&b=
但是到目前为止我的努力都失败了。
我尝试了以下内容
thisURL = http://www.vigimeteo.com/PREV/obs/obs_seul.html?a=07005&b=
theURL = getURL(thisURL,.opts = list(ssl.verifypeer = FALSE) )
tables = readHTMLTable(theURL)
这导致一个空表
它似乎可能是R's Selenium package could have a potential solution,但我还没有弄清楚如何在这里使用它,可能是因为不熟悉
我觉得我在这里错过了一个重要的部分......也许是因为我缺乏JS和XML的知识?
更新:
我注意到,如果我右键单击表格元素并使用Chrome的“检查”,它会生成包含所有表格值的HTML,并且会非常可擦...我仍然不确定如何但是在R中达到这一点。任何人都有关于在“检查”屏幕上查看哪些内容的提示,以尝试指导我的进度?
对此的解决方案如下。
感谢@XR SC的回答:web scraping using Chrome Dev Tools提供基本方法。