Nodejs:我想从nba.com/stats中删除html,但是我没有得到整个html的请求

问题描述 投票:0回答:1

我正在尝试使用nodejs废弃https://stats.nba.com/players/traditional/?sort=NBA_FANTASY_PTS&dir=-1&Season=2018-19&SeasonType=Regular%20Season&LastNGames=3,但我没有得到与网站上显示的相同的html,我想要从表中获取数据,但只有当你检查网站上的元素时才会出现,我尝试使用request + cheerio ,jquery,scrap-table但他们总是废弃源html。

javascript node.js web-scraping request cheerio
1个回答
0
投票

是的,这是因为该网站是使用Angular构建的。该页面使用Javascript生成。所有请求都是基本HTML,但它在此处停止。它不会获取脚本,也不会构建DOM。

你需要一个更强大的工具:像PhantomJSPuppeteer这样的无头浏览器。

这些不仅会加载基本HTML,还会加载脚本,并像真正的浏览器一样。然后,您可以从中提取完全构建的HTML页面。

© www.soinside.com 2019 - 2024. All rights reserved.