一年内查看 Instagram 和/或 Facebook 文本和图像

问题描述 投票:0回答:1

我是一名研究人员,对 python 和 R 有基本但实用的熟悉。为了我的研究,我需要查看 2023 年一系列页面中的 Facebook 和/或 Instagram 帖子。

理想情况下,我的代码将识别 2023 年以来的所有帖子,并向我返回社交媒体图像、标题和发布日期。我不需要对图像或文本进行任何形式的分析。我只需要能够查看图像,使用简单的“查找”命令搜索文本,并查看发布日期。它看起来类似于 picuki.com,供参考。

这样的事情会很容易并且免费吗?我不知道从哪里开始,但欢迎任何建议或想法!非常感谢。

python r facebook instagram social-media
1个回答
0
投票

该过程并不那么简单,因此每个步骤可能会过长。不过,这里有一些提示。

首先,一种更非正式的方法:只需将

?__a=1&__d=dis
添加到 Instagram 网址的末尾,例如“https://www.instagram.com/instagram/?__a=1&__d=dis”,将显示一个 json 格式的文件,其中包含直接链接和一些帖子信息。另请参阅有关 SO 的问题。请注意,您很快就会遇到基于 IP 的速率限制,因此除非您考虑解决方法,否则它可能行不通。

Bibliogram 可能会促进某些过程,并且直到最近在本地部署时才可以工作,但恐怕目前它可能无法维护。

更正式地说,通过 Instagram 自己的 API,可以检索有关其他 Instagram Business 和 Creator 帐户发布的帖子的基本信息...因此,如果您感兴趣的帐户属于这些类别,您可以使用“business”找到可行的解决方案发现”端点。

https://developers.facebook.com/docs/instagram-api/guides/business-discovery

传递如下字段:

business_discovery.username(zara){followers_count,media_count,media{comments_count,like_count,media_url}}
将包含您可以下载的媒体的直接 URL,在本例中为用户“zara”。

作为快速浏览、比较和过滤图像的界面,可以从 R(很快也可以从 Python)创建,您可能需要考虑 Trelliscope,它易于配置和自定义,可以很好地为您服务目的。

如果您对 R 有基本的了解,第二部分(将图像放入 Trelliscope 中进行快速过滤和比较)属于“容易做的事情”。从 Facebook 和 Instagram 上您现在不使用的帐户中检索许多图像属于“诚实地”相当复杂的类别”。如果数字不是很大,老实说,手动下载它们可能会更快。

© www.soinside.com 2019 - 2024. All rights reserved.