我正在开展一个数据分析项目,研究 Instagram 上波斯语用户中有毒男性气质的兴起。我有一个直接的方法从 Twitter 获取数据,并且能够使用官方 API 和名为 Snscrape 的非官方数据抓取 Python 库获取数据。
twitter 的方法包括在特定时间范围内获取一定数量的数据,如下所示:
for i,tweet in enumerate(sntwitter.TwitterSearchScraper('Keyword since:2021-07-05 until:2022-07-06').get_items()):
if i>150:
break
attributes_container.append([tweet.date, tweet.likeCount, tweet.sourceLabel, tweet.content])
但是Instagram的API对我来说太复杂了,我什至不知道是否可以获取这样的数据。需要明确的是,我需要获取某个关键字的自然语言数据,例如获取 1000 条包含 #Alpha_Male 的评论。或者获取 100 个带有该主题标签的帖子。然后我可以使用LDA和情感分析方法来分析数据。
你知道这种研究是否可行吗?如果是的话,您能告诉我获取数据所需的工具吗?我确实有来自 Facebook 开发人员的 API,并且我在那里有活跃的 Instagram 应用程序。但我不知道如何在我的研究中使用它们。即使你能帮助我介绍一个好的 python 库,我也会非常感激。
为了我的研究项目(有关波斯语用户社区中有毒男性气质的兴起)从 Instagram 收集自然语言数据,我最初探索了使用 Instagram API 的可能性。鉴于我使用官方 API 和 Snscrape 收集 Twitter 数据的成功经验,我对为 Instagram 找到类似的方法感到乐观。
我的第一步涉及查看 Instagram Graph API 文档并了解可用的端点和参数。拥有来自 Facebook 开发人员和注册的 Instagram 应用程序的有效 API 密钥,但我发现它太复杂,并且我不确定是否可以使用此方法获取此类数据。
截至 2021 年 9 月我的最后一次知识更新,Instagram 的政策和用于访问其数据的可用工具可能已经发生变化。在尝试从平台收集数据之前,有必要检查 Instagram 或 Facebook(Instagram 的所有者)提供的最新服务条款和开发者指南。以下是从 Instagram 获取自然语言数据的两种主要方法:
Instagram 官方图 API:
数据抓取:
以下是一些需要记住的注意事项:
合规性:始终确保遵守 Instagram 的服务条款、开发者指南和 API 使用政策。违反这些条款可能会导致您的访问权限被撤销或采取法律行动。
API 限制: Instagram Graph API 可能对您可以访问的数据有限制,例如您在特定时间范围内可以发出的请求数量。查看 API 文档了解详细信息。
道德使用:收集用户生成的内容时请注意道德考虑。必要时务必获得明确同意,并尊重用户隐私。
数据隐私:如果您正在收集和存储用户数据,请确保遵守 GDPR 或 CCPA 等数据隐私法规。
替代方案:如果您的目标是分析社交媒体数据,请考虑使用能够访问 Instagram 数据并提供分析服务的第三方工具或服务。这些服务通常与 Instagram 签订了协议,可以在不违反服务条款的情况下为您提供所需的数据。
及时了解 Instagram 关于数据访问和使用的政策和指南的任何变化至关重要。根据您的具体使用案例,您可能需要探索官方 API 选项或咨询法律专家,以确保遵守所有相关法规和服务条款。