Web抓取是从不易提供API或其他自动数据检索方法的网站中提取特定信息的过程。关于“如何开始使用刮擦”(例如使用Excel VBA)的问题应该*进行彻底的研究*,因为有许多功能代码示例可供使用。 Web抓取方法包括第三方应用程序,定制软件的开发,甚至是标准化方式的手动数据收集。
Excel VBA Web源代码 - 如何将多个字段提取到一个工作表
大家下午好。在对QHarr非常解决的上一个查询的后续跟进中,我想要从源代码而不是仅仅一个来对多个字段运行已解决的查询。 ...
我试图从这里抓取数据,但得到错误。我从这里采取代码使用Selenium和python进行刮擦这段代码工作得非常好,但现在我收到错误wait.until(EC ....
我试图通过VBA自动化报告。我曾在VBA工作,但无法通过代码登录iTunes网站。有人告诉我它是用IFrame编写的,但我不知道。即使我......
如何使用beautifulsoup打印href属性,同时通过硒自动化?
蓝色元素的href值是我想要从这个HTML访问我尝试了几种方法来打印链接,但没有工作。我的代码如下: - discover_page = BeautifulSoup(r.text,'html.parser')...
试图在google工作表上制作一个电子表格,用于从网站上删除数据。我想从rsbuddy交换中获得物品的售价,例如:https://rsbuddy.com/exchange/?id = 1745我有......
在讨论了我的问题后,无法使用beautifulsoup打印链接,同时通过selenium自动化,我意识到主要问题是在URL中请求无法...
如何让这段代码通过网站的所有430页并输出到文件? >>>导入请求,bs4 >>> resp = requests.get('https://everythingrs.com/tools/osrs / ...
来自bs4导入BeautifulSoup导入重新导入urllib2 import urllib list_open = open(“weblist.txt”)read_list = list_open.read()line_in_list = read_list.split(“\ n”)for line_in_list中的url:...
我编写了一个脚本,在使用从这个网址填充的链接后解析每个页面的标题。为了更清楚:我的下面的脚本应该解析登陆页面上的所有链接和...
我正在抓住这个页面:https://www.pro-football-reference.com/years/2018/week_1.htm这是美式足球的比赛列表。我想打开第一场比赛的统计数据链接。 ...
我正在使用Pycharm并且它给出了错误:selenium.common.exceptions.WebDriverException:消息:未知错误:Element
我正在尝试从下拉列表中选择一个选项,该选项在网页中使用Selenium webdriver使用VBA。每个复选框有8个复选框,选择2或3个下拉菜单,复选框3和4有......
我试图从以下网址抓取数据:https://www.pro-football-reference.com/boxscores/201809060phi.htm具体来说,我想要“通过,冲,和接收”表中的信息。一世 ...
使用Python中的Selenium将密钥发送到文本字段时的TypeError
尝试使用Python将文本发送到文本字段时,我遇到了一个非常奇怪的问题。这是我的代码:keyword_text_field = driver.find_element_by_xpath('// * [@ id =“558450155”]')...
我想以某种形式的表格的形式从下面的链接收集数据到网站...有人能给我一个线索,因为我对编程知识不高。我知道一些事情,可以学习,但我太老了......
我想废弃标签和class =“author track”的网页上的所有链接。在网页上有这样的多个URL但是当我运行程序时,我的列表是空的一个HTML示例: - &...
我正在尝试从一个带有python的zip文件中捆绑的网站下载一堆PDF文件。要下载zip文件,我单击一个下载按钮,弹出一个弹出窗口(我假设这是...
使用布尔值来使用Python lxml执行不同的XPath表达式
我试图使用python脚本和lxml从网站上抓取天气数据。风速数据将被拉出并附加到列表中以供稍后操作。我能够得到我需要的信息......
Python - Beautifulsoup | ValueError:不支持或无效的CSS选择器:“
我试图从fareham.gov.uk网页上删除一个应用程序,每次我尝试它都会返回错误而不是参考号。有人可以帮我解决这个问题吗?我是新来的......