screen-scraping 相关问题

屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。

为什么浏览器中的网页关闭得这么快?

抱歉我的英语不好 当我尝试使用 Pool 打开多个窗口浏览器时 - 它立即关闭。 我想这已经发生了,当然我收到了这个错误(我最近开始收到这个错误,当...

回答 1 投票 0

iPhone 和服务器之间的安全通信?

我正在开发一个连接到基于 XML 的 API 的应用程序。我可以控制服务器和应用程序 - 有什么方法可以确保只有我的应用程序可以访问 API? 没有用户

回答 5 投票 0

如何在 Windows 上拦截 Toast 通知,从中复制文本,然后将其粘贴到所需位置?

我希望你一切都好。 我正在尝试创建一个程序(自动化过程)来登录某个网站,这会提示 Duo Push(身份验证方法)将短信发送到我的...

回答 1 投票 0

在 R 中抓取会创建 18 个小标题

我正在尝试学习如何在 R 中抓取数据。使用其他资源和聊天 gpt 的一些帮助,我有代码可以抓取 NAIA 棒球统计数据表,但它会创建 18 个小标题。它确实抓住了...

回答 1 投票 0

linkedIn 选择器频繁更改

我一直在使用 Puppeteer 来抓取 LinkedIn 个人资料,但我一直面临着 LinkedIn 选择器定期更改的问题。变得有点累了。有没有人有

回答 1 投票 0

多个选择器上的 Puppeteer waitForSelector

我有 Puppeteer 通过查找表单控制网站,该表单可以返回结果或“未找到记录”消息。我怎么知道哪个被退回了? waitForSelector 似乎只等待...

回答 11 投票 0

尝试制作一个抓取工具来从网站下载文件

我一直在尝试为 Chrome 构建一个插件,它将下载页面上的所有文件到一个与桌面上的文件命名相同的文件夹中。目前,什么也没有发生。 我有这些文件...

回答 0 投票 0

读取固定宽度文件时出现问题

我正在尝试运行这个简单的脚本: 从 ibgeparser.microdados 导入 Microdados 从 ibgeparser.enums 导入 Anos、Estados、Modalidades 如果 __name__ == "__main__": ano = Anos.DEZ

回答 1 投票 0

为什么这个简单的脚本不起作用?

我正在尝试将固定宽度文件转换为 csv。事实上,我发现有一个 github 存储库可以完成这项工作。所以我尝试这样使用它: 从 ibgeparser.microdados 导入 Microdados 来自

回答 1 投票 0

更改语言 requests_html python

我有一个网站试图使用 requests_html 来绕过它 但它只需要阿拉伯语我需要标题的英文文本等等.. 进口熊猫 从 requests_html 导入 HTMLSession 导入时间 我...

回答 1 投票 0

如何使用 selenium 查找 svg 元素并检索已发布的 Facebook 帖子中的日期/时间值?

如您所知,最近 Facebook 正在使用 svg 标签来加载发布帖子的数据和时间。 我想检索某些特定帖子的价值。挑战是首先悬停并等待

回答 1 投票 0

使用简单的 Instagram Scraper 时遇到问题[重复]

我对所有编程知识都很陌生,我正在为我的社会工程项目学习Python。如果你撞到了自己的额头,真的很抱歉。 所以现在我正在看一个教程来编写...

回答 2 投票 0

使用 XMLHTTP 进行亚马逊 URL 抓取 - 亚马逊屏蔽?

因此,如果我使用浏览器浏览产品的卖家列表,例如: https://www.amazon.co.uk/gp/offer-listing/B076C6769Z/ref=dp_olp_new?ie=UTF8&condition=new 我看到卖家名单......

回答 1 投票 0

使用 python 从 chronotrack 运行结果中抓取网页

我正在尝试从运行事件结果 chronotrack 平台上抓取结果。 例如,您可以在此链接上查看 2022 年智利圣地亚哥马拉松赛的成绩:https://results.chronot...

回答 1 投票 0

如何抓取鼠标悬停在元素上时出现的文本?

在网站上 https://www.cpubenchmark.net/cpu.php?cpu=Intel+Core+i9-11900K+%40+3.50GHz&id=3904 我试图在“定价历史&q...”中抓取所有工具提示信息、CPU 的价格和日期...

回答 1 投票 0

可以从移动应用程序实时抓取吗?

我希望能够从移动应用程序中抓取数据,该应用程序根据我的位置实时生成结果。例如。我希望能够实时提取距离我最近的出租车在哪里的数据...

回答 2 投票 0

单击带有 seleniumbase 的元素

我正在尝试单击带有 seleniumbase 的元素,但它没有按预期发生 我尝试了以下方法,但由于某种原因它不起作用: driver.click('div[class="ovm-

回答 1 投票 0

可以从这个网站的地图上抓取数据吗?

是否可以使用Python从地图中抓取数据 https://www.kiabi.com/magasins.html 我需要从每个蓝色项目符号中抓取信息。 我尝试查看源代码并找到

回答 1 投票 0

用 Selenium 刮取 div

我正在尝试选择一个元素以在页面上单击它(https://twitchtracker.com/riotgames/games)。该元素是日历弹出窗口上的可选日期。 这是 我正在尝试选择一个元素以在页面上单击它(https://twitchtracker.com/riotgames/games)。该元素是日历弹出窗口上的可选日期。 是 <div class="day unit in-range" data-time="1698822000000">1</div>. 有没有办法使用 data-time="1698822000000" 元素来选择元素。 我尝试使用 By.CSS_SELECTOR 但总是收到“无法定位元素”错误。 您可以使用 get_attribute 函数从 selenium Web 元素中获取 tag 值,如下所示: element= driver.find_element(By.XPATH,"//div[@class='day unit in-range']") date_time=element.get_attribute('date_time')

回答 1 投票 0

如何使用 python 抓取 Linkedin 帖子 url

如何截取LinkedIn上特定人员的帖子网址并将其存储到Excel文件中以供进一步使用? 我希望解决问题或代码或任何可用的 github 存储库的方法有点小……

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.