web-scraping 相关问题

Web抓取是从不易提供API或其他自动数据检索方法的网站中提取特定信息的过程。关于“如何开始使用刮擦”(例如使用Excel VBA)的问题应该*进行彻底的研究*,因为有许多功能代码示例可供使用。 Web抓取方法包括第三方应用程序,定制软件的开发,甚至是标准化方式的手动数据收集。

Excel VBA Web源代码 - 如何将多个字段提取到一个工作表

大家下午好。在对QHarr非常解决的上一个查询的后续跟进中,我想要从源代码而不是仅仅一个来对多个字段运行已解决的查询。 ...

回答 2 投票 1

从漏斗中抓取svg标签

我试图从这里抓取数据,但得到错误。我从这里采取代码使用Selenium和python进行刮擦这段代码工作得非常好,但现在我收到错误wait.until(EC ....

回答 1 投票 -1

iTunes的自动化连接VBA

我试图通过VBA自动化报告。我曾在VBA工作,但无法通过代码登录iTunes网站。有人告诉我它是用IFrame编写的,但我不知道。即使我......

回答 1 投票 0

如何使用beautifulsoup打印href属性,同时通过硒自动化?

蓝色元素的href值是我想要从这个HTML访问我尝试了几种方法来打印链接,但没有工作。我的代码如下: - discover_page = BeautifulSoup(r.text,'html.parser')...

回答 3 投票 0

谷歌表上的IMPORTxml

试图在google工作表上制作一个电子表格,用于从网站上删除数据。我想从rsbuddy交换中获得物品的售价,例如:https://rsbuddy.com/exchange/?id = 1745我有......

回答 2 投票 3

无法在python中访问带有请求的网页

在讨论了我的问题后,无法使用beautifulsoup打印链接,同时通过selenium自动化,我意识到主要问题是在URL中请求无法...

回答 1 投票 1

需要帮助获取代码以循环访问网站

如何让这段代码通过网站的所有430页并输出到文件? >>>导入请求,bs4 >>> resp = requests.get('https://everythingrs.com/tools/osrs / ...

回答 1 投票 0

使用Jsoup从网页抓取数据[关闭]

我是Jsoup的新手,我需要从下面的网页上抓取数据。链接在这里。网页

回答 1 投票 0

从多个网站提取文本

来自bs4导入BeautifulSoup导入重新导入urllib2 import urllib list_open = open(“weblist.txt”)read_list = list_open.read()line_in_list = read_list.split(“\ n”)for line_in_list中的url:...

回答 1 投票 1

无法使用函数解析某些链接的标题

我编写了一个脚本,在使用从这个网址填充的链接后解析每个页面的标题。为了更清楚:我的下面的脚本应该解析登陆页面上的所有链接和...

回答 1 投票 1

使用Python进行Web抓取时从链接中拉出href

我正在抓住这个页面:https://www.pro-football-reference.com/years/2018/week_1.htm这是美式足球的比赛列表。我想打开第一场比赛的统计数据链接。 ...

回答 1 投票 0

用硒刮评论

我正在使用Pycharm并且它给出了错误:selenium.common.exceptions.WebDriverException:消息:未知错误:Element

回答 1 投票 0

无法使用selenium VBA从网页中选择下拉菜单

我正在尝试从下拉列表中选择一个选项,该选项在网页中使用Selenium webdriver使用VBA。每个复选框有8个复选框,选择2或3个下拉菜单,复选框3和4有......

回答 1 投票 2

试图抓取特定的HTML进行网页搜索

我试图从以下网址抓取数据:https://www.pro-football-reference.com/boxscores/201809060phi.htm具体来说,我想要“通过,冲,和接收”表中的信息。一世 ...

回答 1 投票 0

使用Python中的Selenium将密钥发送到文本字段时的TypeError

尝试使用Python将文本发送到文本字段时,我遇到了一个非常奇怪的问题。这是我的代码:keyword_text_field = driver.find_element_by_xpath('// * [@ id =“558450155”]')...

回答 2 投票 0

以表格或类似形式将XML或CSV数据从链接收集到网站中

我想以某种形式的表格的形式从下面的链接收集数据到网站...有人能给我一个线索,因为我对编程知识不高。我知道一些事情,可以学习,但我太老了......

回答 1 投票 0

无法使用beautifulsoup在python中删除链接

我想废弃标签和class =“author track”的网页上的所有链接。在网页上有这样的多个URL但是当我运行程序时,我的列表是空的一个HTML示例: - &...

回答 1 投票 2

Web Scraping - 下载Zip文件

我正在尝试从一个带有python的zip文件中捆绑的网站下载一堆PDF文件。要下载zip文件,我单击一个下载按钮,弹出一个弹出窗口(我假设这是...

回答 1 投票 0

使用布尔值来使用Python lxml执行不同的XPath表达式

我试图使用python脚本和lxml从网站上抓取天气数据。风速数据将被拉出并附加到列表中以供稍后操作。我能够得到我需要的信息......

回答 1 投票 0

Python - Beautifulsoup | ValueError:不支持或无效的CSS选择器:“

我试图从fareham.gov.uk网页上删除一个应用程序,每次我尝试它都会返回错误而不是参考号。有人可以帮我解决这个问题吗?我是新来的......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.