scrapy-splash 相关问题

scrapy-splash是一个scrapy插件,用于将Scrapy框架与Splash集成--JavaScript渲染服务

使用Scrapy从动态网页中抓取网址

我想在Scrapy中制作一个网络抓取工具,以从该网站提取10000个新闻链接https://hamariweb.com/news/newscategory.aspx?cat=7当我向下滚动更多链接负载时,此页面是动态的。 ..

回答 1 投票 0

为什么scrap抓的飞溅返回我原来的网址?

花了一段时间,但我终于明白了差异在哪里!网址为https://www.meetup.com/Google-Cloud_Meetup_Singapore_by_Cloud-Ace/events / ...]的抓取抓取MeetupGetParticipants,网址为:

回答 1 投票 0

通过Scrapy飞溅传递真实的URL字典

当试图通过(“URL”:response.request.url)保存在字典中的URL Scrapy保存来自Scrapy飞溅这些都是相同的网址(http://本地主机:8050 / render.html)我已经尝试添加额外...

回答 1 投票 0

无法在Ubuntu上安装溅到泊坞窗

我试图安装溅到码头工人,但这样做时,我得到的错误“Exec的格式错误”,但我从这里直接跟随输入:https://splash.readthedocs.io/en/stable/install.html我。 ..

回答 1 投票 0

Lua脚本无法单击按钮

我正在尝试使用这个lua脚本从scrapy-splash中删除链接:function main(splash)local waiting_time = 2 - 转到URL断言(...

回答 1 投票 1

TypeError:close_spider()缺少1个必需的位置参数:'reason'

当执行蜘蛛数据从页面中提取但是当管道启动时出现问题...我收到以下错误:Traceback(最近一次调用最后一次):文件“C:\ Users \ ...

回答 1 投票 1

带有Splash的CrawlSpider在第一个URL后卡住了

我正在写一个scrapy蜘蛛,我需要用splash来渲染一些响应。我的蜘蛛基于CrawlSpider。我需要渲染我的start_url响应来喂我的爬行蜘蛛。不幸的是

回答 2 投票 3

Scrapy splash spider不遵循链接来获取新页面

我从使用Javascript链接到新页面的页面获取数据。我正在使用Scrapy + splash来获取此数据,但是,出于某种原因,链接未被遵循。这是代码......

回答 2 投票 2

Scrapy,Splash和Connection被另一方拒绝:10061

我在Javascript驱动的网站上使用scrapy with splash。但是,我无法通过连接被另一方拒绝:10061错误。我得到这样的日志:[scrapy.downloadermiddlewares.retry] ...

回答 1 投票 0

scrapy-spash:SplashRequest响应对象在scrapy crawl和CrawlerProcess的调用之间有所不同

我想使用scrapy-splash来获取目标页面的html和截图png。我需要能够以编程方式调用它。根据spashy doc,指定endpoint ='render ....

回答 1 投票 1

如何在水族馆/ scrapy-splash中加载LUA模块?

我正在研究用于scrapy-splash的LUA脚本,并希望使用socket.http模块。该模块已安装,我已禁用沙箱并配置了包路径。但我无法让它发挥作用。 ...

回答 1 投票 1

scrapy File(unknown-error):从中下载图像时出错 提到 :'泼水'

我想使用splash下载带有scrapy的图像。当我运行代码时,我收到以下错误:2019-04-09 11:09:32 [scrapy.pipelines.files]警告:文件(未知错误):下载错误...

回答 1 投票 0

如何使用Scrapy + Splash在同一页面上单击2个按钮?

单击链接弹出通知后会出现一个页面。因此,要按照链接lua脚本应单击按钮1,然后单击按钮2(在弹出通知上接受)然后...

回答 1 投票 0

如何使用yield函数从多个页面中抓取数据

我正试图从亚马逊印度网站上搜索数据。在以下情况下,我无法收集响应并使用yield()方法解析元素:1)我必须从产品页面转到评论页面2)我有......

回答 1 投票 1

无法导入'scrapy_splash'pylint(import-error)

当尝试在VS代码中导入Splash Request时,我收到以下错误消息:无法导入'scrapy_splash'pylint(import-error)你知道为什么会这样吗?我有飞溅......

回答 1 投票 2

Scrapy Splash:点击按钮无法打开下一页

我无法使用Scrapy-Splash执行Click按钮。我试图抓住的网站就是这个:https://search.siemens.com/en/?q = iot&lr = lang_en&as_oq =&as_sitesearch =&...

回答 1 投票 0

如何从scrapy-splash获取200以外的状态代码

我正在尝试使用scrapy和scrapy-splash获取请求状态代码,下面是蜘蛛代码。 class Exp10itSpider(scrapy.Spider):name =“exp10it”def start_requests(self):urls = [...

回答 1 投票 1

抓取包含锚标签 using scrapy的网页

我正在刮宏,我想进入下一页,当我检查“下一步”时,我得到:Next

回答 1 投票 1

使用加载了Ajax(scrapy)的表单登录:selenium v s scrapy-splash

要抓取我想要的网页,我需要登录。要访问登录表单,我必须单击一个按钮。此按钮发出一个AJAX请求,显示表单。我使用Scrapy,用中间件来......

回答 1 投票 0

Scrapy Splash无法获取React站点的数据

我需要废弃这个网站。是反应所以看起来。然后我尝试用scrapy-splash提取数据。我需要例如带有class shelf-product-name的“a”元素。但回应是......

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.