我正在从twitter收集数据进行数据分析。我需要一个包含“#depression”标签的推文集合来制作数据集。很难去搜索然后复制和粘贴。如果有任何现有的代码/插件/ api来获取用户名和发布日期的所有帖子?我将使用它来存储我的Excel数据集上的帖子,用户名和日期。
我会为此推荐一些python。很明显,这里似乎是一个脚本,可以像你想要的那样做。它将使用指定的#tag从指定日期获取所有推文,并将其打印到CSV文件。我想你可以在Excel中导入文件。
剧本:https://gist.github.com/vickyqian/f70e9ab3910c7c290d9d715491cde44c
我没有彻底阅读 - 所以在调用之前请仔细阅读。当然要替换#tag参数:
...
for tweet in tweepy.Cursor(api.search,q="#depression",count=100,
...
您还需要设置参数:
consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''
以下是如何获取这些内容的说明:
https://developer.twitter.com/en/docs/basics/authentication/guides/access-tokens.html
您需要在此行中指定所需的字段
print (tweet.created_at, tweet.text)
这些字段可用:
text = tweet.text
language = tweet.lang
date = tweet.created_at
username = tweet.user
retweets = tweet.retweet_count
likes = tweet.favorite_count
所以你可以改成它:
print (tweet.created_at, tweet.user, tweet.text)