我的推文 ID 列表很少,我想抓取所有回复。有什么办法可以做到吗?我尝试了 beautifulsoup 和 selenium 但没有运气
Twitter 有一个 API 可以完成此任务。
你会想用这个: https://developer.twitter.com/en/docs/twitter-api/tweets/lookup/api-reference/get-tweets-id
看起来您需要使用页面底部的“includes”或“includes.tweets”字段。您需要注册一个开发帐户并创建一个开发应用程序,但这一切都是免费的,并且不需要太多时间。此外,所有示例代码均采用 Java 和 Typescript 编写,但您应该能够使用“requests”库在 Python 中完成所有操作。
我认为你需要申请一个“Elevated”开发帐户才能使用 v2,但我不记得了。我申请并立即被接受,所以无论如何这都不成问题。创建应用程序后,复制不记名令牌,以便您可以在 Python 中发出 API 请求。您将发出 GET 请求并在标头中提供您的 Bearer 令牌。它的要点如下:https://reqbin.com/req/python/5k564bhv/get-request-bearer-token-authorization-header-example
查询示例:
https://api.twitter.com/2/tweets/{tweet_id}?expansions=author_id&tweet.fields=created_at