r:抓取javascript web工资

问题描述 投票:0回答:1

我试图刮网页,因此我使用了read_html命令。但我无法废弃我想要的桌子。我认为这个页面是用javascript。我不知道如何处理它。这就是我所做的

  url=paste0("http://www.oddsportal.com/baseball/usa/mlb-2006/results/#/page/2/")
site=read_html(url)%>%html_nodes('.tournamentTable')

或者site=read_html(url) t<-html_nodes(site,"table")%>%html_table(fill=TRUE)

但我得到了{xml_nodeset (0)}。我的代码有什么问题?或者这个网站需要使用其他命令??

我也尝试过read_html(url)%>%html_nodes("table")。但是这个命令的表格是网页中的其他边表。它无法刮掉主桌。

谢谢您的帮助..

javascript web-scraping nodes
1个回答
0
投票

我们使用html_nodes()函数来选择节点。

首先,我们将网页读作:

webpage <- read_html("http://www.test.com/One.htm")
tbls <- html_nodes(webpage, "table")

请参阅以下链接以供参考:http://bradleyboehmke.github.io/2015/12/scraping-html-tables.html

如果满足您的要求,请将答案标记为已回答。

© www.soinside.com 2019 - 2024. All rights reserved.