我正在使用Python进行表情符号推荐系统的项目。第一步是从twitter收集数据。具体来说,我需要使用顶级流行表情符号的推文。我正在考虑抓取网站或使用twitter API。但我没有在twitter文档中看到如何使用某些表情符号进行搜索(可能使用其unicode,例如,U + 1F602)。
提前致谢!
Twitter Rest API指定了对search/tweets的调用
返回与指定查询匹配的相关推文的集合。
查询参数q
应该是UTF-8编码,因此请尝试传递您正在寻找的表情符号的UTF-8编码。
编辑:我刚刚在其中发布了带有表情符号的推文,它们是图像,所以看起来你不能搜索它们。
我设法在这篇文章的帮助下做了qazxsw poi
我没有搜索https://medium.com/@mroth/how-i-built-emojitracker-179cfd8238ac#a5d7,而是搜索了u'\U0001F602'
,我开始了以下结果:
1F602
通过UTF-8编码搜索对我来说不起作用,但我很幸运只是在查询中复制和粘贴表情符号。 api = tweepy.API(auth)
print api
query = '1F602' # u'\U0001F602'
print query
max_tweets = 10
search = tweepy.Cursor(api.search, q=query).items(max_tweets)
for status in search:
print status.text
。
更新后的代码如下所示:
I think this became supported in 2017
我不确定为什么这样做并且使用编码不行。如果您尝试搜索编码,它将搜索文字字符串。