python-requests 相关问题

Requests是一个功能齐全的Python HTTP库,具有易于使用的逻辑API。

Python 请求:从有效负载中提取数据

目前我正在研究Python requests 模块。我正在尝试自动化一项需要传递 csrf 令牌的任务。 csrf 令牌可以在先前请求的有效负载中找到。 嗬...

回答 1 投票 0

如何使用 Python Playwright(或替代方案)将网站中的数据抓取到 CSV 文件中,同时避免访问错误并提高速度?

我正在尝试使用 Python 和 Playwright 从该网站抓取数据,但遇到了一些问题。浏览器以非headless模式运行,进程非常慢。当我尝试其他

回答 1 投票 0

为什么请求(或urllib3)继续抛出超时值错误,即使我没有更改它们?

我正在尝试为一些大型构建软件创建一个插件,以将数据从公共 Rest API 提取到软件中。当尝试获取数据时 r = requests.get(self.Server + "/me...

回答 1 投票 0

如何使用Python获取请求中响应的原始内容?

尝试用Python获取请求中HTTP响应内容的原始数据。我有兴趣通过另一个渠道转发响应,这意味着理想情况下内容应该是

回答 4 投票 0

ValueError:未终止的字符串起始于:在 Python 3.7 中递归调用 API 端点时出错

我正在尝试连接到API端点,获取json响应,写入并扩展响应(循环页面:页面总数为200,项目数:41500)到列表。还有

回答 1 投票 0

在网页抓取时获取隐藏在省略号中的数据

我正在尝试获取该网站标题上显示的剧集标题。当我自己检查页面元素时,我可以在顶部附近看到一行 HTML,如下所示: .... 我正在尝试获取此网站标题中显示的剧集标题。当我自己检查页面元素时,我可以在顶部附近看到一行 HTML,如下所示: <h1 id="epName">...</h1> 单击省略号时会打开 <h1 id="epName">Friendship is Magic, Part 1</h1> 我尝试将其自动化,以便我可以将相应的剧集保存为其实际标题,而不是我当前使用的季集代码 我尝试过基本的请求呼叫 url ='https://fim.heartshine.gay/?s=1&e=1&res=480&lo=0' x = requests.get(url) text = x.text print(text) 但重要的结果是 </head> <body onload="initPage();"> <h1 id="epName"></h1> <div> h1 标签之间没有实际信息。 我也尝试过 Selenium,因为我猜测这可能是一个支持 JavaScript 的函数: from selenium import webdriver driver = webdriver.Safari() driver.get("https://g1.heartshine.gay/?s=1&e=46&res=480") print(dir(driver)) driver.execute_script('changeEp') #this button controls the resulting epName p_element = driver.page_source print(p_element) 但我再次从上面得到相同的相关输出 此处不需要 selenium,因为数据是从 此 JSON 文件动态获取的。您可以使用requests.get(url).json: import requests url = 'https://fim.heartshine.gay/db.json' data = requests.get(url).json() 关于如何找到此类来源,请参阅例如这里。 第 1 季 (s=1)、第 1 集 (e=1) 的标题为: data['series']['seasons'][0]['episodes'][0]['epTitle'] # 'Friendship is Magic, Part 1' 但是将所有数据存储在 pd.DataFrame 中可能会很有用。例如,使用 pd.json_normalize: import pandas as pd seasons = data['series']['seasons'] cols = ['seasNum', 'epNum', 'epTitle'] df = (pd.json_normalize(seasons, record_path='episodes', meta=['seasNum']) [cols] )

回答 1 投票 0

为什么从 Instagram 抓取关注者计数失败?

我正在尝试抓取用户名数组的关注者数量。我正在使用美丽汤。 我正在使用的代码如下 导入请求 从 bs4 导入 BeautifulSoup def instagram_follo...

回答 4 投票 0

为什么通过特定类查找元素会导致空结果?

我正在使用 Python、Requests、bs4 库开发一个网络抓取项目。 我试图抓取 IPL 的网页,我想从该页面获取每个赛季每场比赛的所有详细信息。

回答 2 投票 0

如何通过 IMDB 分页容器加载系列的附加剧集?

我正在编写这段代码: 导入请求 从 bs4 导入 BeautifulSoup url = 'https://www.imdb.com/title/tt5189554/episodes/' 标题= { “连接”:“保持活动”, ”

回答 3 投票 0

无法找到网页的 div 标签、类值

我正在使用 Python、Requests、bs4 库开发一个网络抓取项目。 我试图抓取 IPL 的网页,我想从该页面获取每个赛季每场比赛的所有详细信息。

回答 1 投票 0

如何使用请求和flask发送和接收图像作为http表单数据的一部分

我想发出一个http POST 请求,并将图像作为多部分/表单数据的一部分。我想避免将此图像编码为 base64,而只是将其作为二进制 blob 发送,我知道......

回答 1 投票 0

如何使用带有授权类型“客户端凭据”的请求 OAuthlib?

所以我尝试调用一个仅在文档中提供令牌 URL 的 API。为此,我想使用 python requests 包中的 OAuthlib。当我查看他们的文档时,他们给出了这个例子: #

回答 2 投票 0

请求 - 使用代理的请求仅返回某些站点的标头数据

导入请求 代理 = {'http://':'3.127.121.101:80','https':"http://3.127.121.101:80"} 数据 = requests.get("https://google.com", proxies=proxies, verify=False) 打印(数据...

回答 1 投票 0

为什么没有按照google-auth库安装requests模块?

我正在使用 Google Calendar API 来获取一些事件,并使用 venv 来容纳所需的所有包,我遇到了一个简单的问题:google.auth.transport.requests 无法运行科...

回答 3 投票 0

使用Python请求模块发送和接收instagram dm消息

使用Python请求模块,是否有机会通过终端向Instagram发送和接收消息而无需使用任何浏览器?我们需要使用Instagram API来拍摄和发送消息吗?

回答 2 投票 0

导致 SSLError DECRYPTION_FAILED_OR_BAD_RECORD_MAC 的原因

我希望你一切都好。 我正在开发一个 Python 程序,该程序利用 MEXC API 检索加密市场的历史数据。 代码可以正确运行大约 100 到 300 次迭代,...

回答 1 投票 0

Python 单元测试获取请求断言错误未接听电话

我正在请求模块下测试基本的 GET 请求。我使用 requests.Session 创建一个会话实例,稍后将其传递到函数中。 我正在嘲笑函数调用。我...

回答 1 投票 0

Python 模拟 - requests.Session() 获取请求断言错误不接听电话

我正在请求模块下测试基本的 GET 请求。我使用 requests.Session 创建一个会话实例,稍后将其传递到函数中。 我现在正在嘲笑函数 cal...

回答 1 投票 0

Content-length header 与手动计算时不一样?

这里的答案(原始响应的大小以字节为单位)说: 只需取响应内容的 len() 即可: >>> 响应 = requests.get('https://github.com/') >>> len(响应。

回答 2 投票 0

原始响应的大小(以字节为单位)

我需要发出 HTTP 请求并确定响应大小(以字节为单位)。 我一直使用 request 来进行简单的 HTTP 请求,但我想知道是否可以使用 raw 来实现这一点? >>> r =

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.