如何从任何网址页面获取数据来抓取评论

问题描述 投票:-4回答:1

假设您有一个游戏商店评论页面,其中有数百人定期评论。我的想法是不仅在同一页面上,而且在滚动时从Play商店评论页面获取数据。那么它应该从评论页面中获取所有数据吗?如果他给出了任何评级。包括他/她的照片。

我如何解决这个问题以及我可以使用哪些工具?分享我可以阅读更多有关此类问题陈述的所有链接。

python web-scraping scrapy web-crawler
1个回答
0
投票

我会使用scrapy循环请求到ajax URL。终止循环的逻辑可以通过几种方式处理,具体取决于可用的数据。

  1. 如果每个回复列表预计长度为N个评论,并且您收到少于N个评论的回复,请中断
  2. 如果有可用的总评论值,则翻页直到请求的页数等于评论总数除以每页评论数。
  3. 存在其他解决方案

How to scrape all contents from infinite scroll website? scrapy

Scraping Infinite Scrolling Pages with "load more" button using Scrapy

https://stackoverflow.com/search?q=scrapy+infinite+scroll

© www.soinside.com 2019 - 2024. All rights reserved.