使用谷歌工作表刮掉XPath

问题描述 投票:0回答:1

我一直在努力让任何XPath技术在octoparse和类似的软件上工作。我现在正在尝试谷歌表阅读这里的帖子,也无法让它工作。

输入:slidehare演示文稿网址(例如https://www.slideshare.net/carologic/ai-and-machine-learning-demystified-by-carol-smith-at-midwest-ux-2017

预期输出:Slideshare嵌入网址(在这种情况下:https://www.slideshare.net/slideshow/embed_code/key/wZudqqTdctjWXA

我认为这将是使用google工作表获取输出的方法:= importxml(A1,“// meta [@ itemprop ='embedURL'] / @ content”)

它对我不起作用(无法获取网址)。有了Octoparse等,我只得到一个空白值。

毫无疑问,我在这里愚蠢。任何帮助都会有用。

xpath google-sheets scrape
1个回答
0
投票

它不起作用,因为slideshare由LinkedIN拥有,并且他们付出了很多努力以确保它们不能被删除,包括谷歌表。在它成为可能之前,但我相信他们最终能够继续努力。

© www.soinside.com 2019 - 2024. All rights reserved.