使用 twitteR 包比较 Twitter 标签量

问题描述 投票:0回答:1

我想使用 R 中的 twitteR 包来比较 2012 年 11 月 14 日至 2012 年 11 月 22 日(即 8 天的时间段)期间两个竞争主题标签的提及次数(计数)。例如,我想每小时比较两个主题标签:#A 与 #B。

我想知道是否有办法使用 R 中的 twittR 包来做到这一点。使用 searchTwitter 功能的东西:

searchTwitter(searchString, n=25, lang=NULL, since=NULL, until=NULL,
              locale=NULL, geocode=NULL, sinceID=NULL, ...)

我对抓取所有推文不感兴趣,只是获取指定时间段内 #A 与 #B 的每小时计数比较。我知道我必须认识到速率限制,并且可能必须对推文进行一些巧妙的采样才能避免速率限制。如果这可行的话,有什么想法吗?我将如何对其进行编码?

r twitter
1个回答
1
投票

我会每 2 分钟为每个主题标签提取 100 条推文。使用 #TweetsReturned / (TimePulled - TimeOfOldestTweet) 获取每单位时间的推文估计值。您可以绘制这些图表以获得随时间变化的移动平均类型的活动图表。如果您每 2 分钟发一条推文,只需将它们相加即可估算每小时的推文数。

© www.soinside.com 2019 - 2024. All rights reserved.