使用 Python selenium 检测某个 Instagram 帖子是否是视频

问题描述 投票:0回答:1

下午好, 考虑这里的这篇文章:(https://www.instagram.com/p/CN4cgcjJN8p/)我用这段代码提取了以下数据:

    likes = driver.execute_script('''return document.getElementsByClassName('Nm9Fw')[0].lastElementChild.getElementsByTagName('span')[0].innerText''')   #extract number of likes

现在,我正在尝试编写一行代码来立即检测正在分析的帖子是否是视频。例如,上面的帖子应该被检测为视频。然而,在检查了 HTML 代码之后,我不确定如何做到这一点。这个想法大概是这样的:

is_video = driver.execute_script(''' '''') #true/false

我不完全确定如何检索此信息,因为可以通过检查名称为“X”或文本“Y”的类来轻松检索其他字段,但我不确定这个。

如何检测这些信息?

非常感谢您的关注。

javascript html selenium-webdriver web-scraping instagram
1个回答
0
投票

似乎类 _97aPb 或 wKWK0 保存了内容。如果有视频,孩子就没有课。检查子级的 getAttribute("class")。

我认为,尽管使用多图像帖子并检查每个孩子是否是视频,但我不知道这是否适用于您的用例,这会带来很多复杂性。

编辑:我错了 getAttribute will notFoundException,而是使用 .classList 并检查长度。

© www.soinside.com 2019 - 2024. All rights reserved.