screen-scraping 相关问题

屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。

AttributeError:抓取 Ebay 产品标题时,“NoneType”对象没有属性“text”

按照本教程使用 Python 创建 Ebay 价格跟踪器,我在尝试从...获取产品标题时遇到了 AttributeError: 'NoneType' 对象没有属性 'text'

回答 1 投票 0

Selenium Web 抓取 C# 尝试返回一个值

我尝试从名为 Bidding Ends 的字段返回日期和时间值: 我尝试过其他代码组合,但似乎无法弄清楚 使用 OpenQA.Selenium; 使用 OpenQA。

回答 1 投票 0

获取:使用 Scrapy 抓取笔记本电脑数据时爬行(302)

我想从 https://www.newegg.com/tools/laptop-finder 抓取屏幕类型和标题等数据 但我被困住了,因为我的脚本被抓取但未被抓取 该网站的 HTML 代码是 ...

回答 1 投票 0

Cloudflare绕过python

我正在尝试解析具有 cloudflare 保护的网站。 在我使用过的大多数 cloudflare 网站上,从浏览器中提取 cf_clearance cookie 并将其粘贴到 re...

回答 3 投票 0

将给定 URL 中的 HTML 表格抓取到 CSV 中

我寻找一个可以在命令行上运行的工具,如下所示: tablecrape 'http://someURL.foo.com' [n] 如果未指定 n 并且页面上有多个 HTML 表格,则应该对它们进行汇总 (

回答 3 投票 0

仅识别与新闻稿页面相关的链接

我的任务是找到给定链接的实际新闻稿链接。例如,说 http://www.apple.com/pr/。 我的工具必须从上面单独找到新闻稿链接...

回答 5 投票 0

如何在网页抓取时绕过验证码

我正在尝试使用 Selenium 从该网站抓取汽车详细信息:https://www.autoscout24.ch/de/autos/alle-marken?vehtyp=10 大约每 30 页我就必须验证我不是机器人, 电子...

回答 4 投票 0

使用BeautifulSoup进行网络清理时遇到的问题

我的问题是我无法捕捉类listing_LinkedListingCard__5SRvZ的div我使用find_all但结果是空列表 链接:https://sa.aqar.fm/%D9%81%D9%84%D9%84-%D9%84%D9%84%D8%A8%D9%...

回答 1 投票 0

在java中屏幕抓取主机屏幕?

我是编程世界的新手,在我的项目中我需要使用 Attachmate 屏幕抓取主机屏幕?谁能告诉我屏幕抓取到底是什么以及它是如何工作的? 谢谢你的建议...

回答 3 投票 0

如何借助selenium点击网站上的“月份”按钮?

我需要能够单击网站上的某个按钮。它位于匈牙利能源市场。我正在使用硒来自动化几个步骤。我收到一个 cookies 弹出窗口,我成功点击了它,但是......

回答 1 投票 0

find_elements_by_xpath 不起作用并返回空列表

我正在尝试抓取 reddits,当 URL 页面 = 'https://www.reddit.com/r/announcements/hot/' 时,下面的代码可以工作 但是,当我稍微更改一下 URL 时,page='https://www.reddit.com/r/

回答 1 投票 0

使用 Python selenium 提取 Instagram 帖子描述

早上好, 我目前正在尝试使用 Python selenium 下载 Instagram 帖子的某个字段。具体来说,我正在尝试下载图片的标题(描述)(对于

回答 4 投票 0

我需要有关点击操作的帮助

这是我的第一个问题:) 我正在寻找一个网站,当接受 cookie 时,我的最后一行出现了问题。饼干 我的最后一行有问题。我尝试使用 CSS 选择器 /...

回答 1 投票 0

如何从每天更新的网站上抓取信息? [已关闭]

我想从每个“Represa...”的“Volumen Util (Hm3)”列中抓取信息,所有这些都来自此链接:https://autodema.gob.pe/reportesom/frmRepChili.aspx。 这是一个...

回答 0 投票 0

如何使用pyppeteer点击带有特定文本的链接

我正在尝试单击带有特定文本的链接,这是一个从网站注销的按钮。 在此处输入图像描述 button = await page.xpath("//a[contains(., 'Abmelden')]") 上面的...

回答 1 投票 0

使用次日日期抓取日历数据问题

早上好,我有一个我不知道如何解决的问题,通过网络抓取,我从我工作的网站上获取数据,并用我的班次创建一个 ics 日历文件,它几乎总是有效......

回答 0 投票 0

R Glassdoor 网页抓取

我的任务是为不同的医院收集 Glassdoor 评论,但我很难提取优点、缺点、对管理的建议、推荐、CEO 批准、业务前景和......

回答 2 投票 0

如何使用“msxml2.xmlhttp”从表中获取数据

HTMLI 正在尝试从网页 https://www.lbma.org.uk/prices-and-data/precious-metal-prices#/table 获取数据 所有的 q 和在线示例看起来都很简单,但我像 kip 一样四处拍打......

回答 1 投票 0

为什么从特定网站抓取效果不佳?

我想从此网址中删除所有警报详细信息 - https://www.oref.org.il/12481-en/Pakar.aspx 我写了这段代码,但我认为是因为“在过去一周”不活跃,所以找不到...

回答 1 投票 0

从具有 API 的文档中抓取数据

我是 JS 及其框架的新手,我正在尝试创建一个抓取机器人,它使用 pandadoc 中生成的文档中的数据(当然使用私钥)并将该数据存储...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.