获取有关抑郁症的用户名和推文

问题描述 投票:0回答:1

我正在从twitter收集数据进行数据分析。我需要一个包含“#depression”标签的推文集合来制作数据集。很难去搜索然后复制和粘贴。如果有任何现有的代码/插件/ api来获取用户名和发布日期的所有帖子?我将使用它来存储我的Excel数据集上的帖子,用户名和日期。

twitter dataset
1个回答
0
投票

我会为此推荐一些python。很明显,这里似乎是一个脚本,可以像你想要的那样做。它将使用指定的#tag从指定日期获取所有推文,并将其打印到CSV文件。我想你可以在Excel中导入文件。

剧本:https://gist.github.com/vickyqian/f70e9ab3910c7c290d9d715491cde44c

我没有彻底阅读 - 所以在调用之前请仔细阅读。当然要替换#tag参数:

...
for tweet in tweepy.Cursor(api.search,q="#depression",count=100,
...

您还需要设置参数:

consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''

以下是如何获取这些内容的说明:

https://developer.twitter.com/en/docs/basics/authentication/guides/access-tokens.html

您需要在此行中指定所需的字段

print (tweet.created_at, tweet.text)

这些字段可用:

text     = tweet.text
language = tweet.lang
date     = tweet.created_at
username = tweet.user
retweets = tweet.retweet_count
likes    = tweet.favorite_count

所以你可以改成它:

print (tweet.created_at, tweet.user, tweet.text)
© www.soinside.com 2019 - 2024. All rights reserved.