我使用下面的方法后链接到Instagram的刮型材。我可以改变我检索图像的数量?在JSON响应我看到了“has_next_page”的参数,但我不知道如何使用它。提前致谢。信息链接:What is the new instagram json endpoint?
使用的代码:
r = requests.get('https://www.instagram.com/' + profile + '/')
soup = BeautifulSoup(r.content)
scripts = soup.find_all('script', type="text/javascript",
text=re.compile('window._sharedData'))
stringified_json = scripts[0].get_text().replace('window._sharedData = ', '')[:-1]
data = json.loads(stringified_json)['entry_data']['ProfilePage'][0]
你可以在这里找到了Instagram的API:https://www.instagram.com/developer/的documentatiopn是整齐漂亮,我认为,你只需要注册,以获取访问令牌。
你的问题是:在你的代码从个人资料页,这意味着你只能得到这是已经装载图像报废数据。这就是为什么你不能只设置一个较大的数目为它让你更多的图像。
我建议下列之一:
1.使用的Instagram的API,来与已建成的方法来做你好像什么想要实现(不重新发明轮子)。
2.相反,如果你想要做的大部分工作自己(比方说作为一个练习)我建议你使用Selenium,这是一个自动化。在你的代码使用BeautifulSoup这是伟大的,用于从HTML文件中的数据,但是你需要做更多的事情:滚动 - 这是为了让更多的图片加载。这样一来,只要你喜欢,你可以得到尽可能多的照片。
如果你需要一个例子,你可以看看我写Twitter的here的类似的例子