我试图刮网页,因此我使用了read_html命令。但我无法废弃我想要的桌子。我认为这个页面是用javascript。我不知道如何处理它。这就是我所做的
url=paste0("http://www.oddsportal.com/baseball/usa/mlb-2006/results/#/page/2/")
site=read_html(url)%>%html_nodes('.tournamentTable')
或者site=read_html(url)
t<-html_nodes(site,"table")%>%html_table(fill=TRUE)
但我得到了{xml_nodeset (0)}
。我的代码有什么问题?或者这个网站需要使用其他命令??
我也尝试过read_html(url)%>%html_nodes("table")
。但是这个命令的表格是网页中的其他边表。它无法刮掉主桌。
谢谢您的帮助..
我们使用html_nodes()函数来选择节点。
首先,我们将网页读作:
webpage <- read_html("http://www.test.com/One.htm")
tbls <- html_nodes(webpage, "table")
请参阅以下链接以供参考:http://bradleyboehmke.github.io/2015/12/scraping-html-tables.html
如果满足您的要求,请将答案标记为已回答。