我一直在努力让任何XPath技术在octoparse和类似的软件上工作。我现在正在尝试谷歌表阅读这里的帖子,也无法让它工作。
输入:slidehare演示文稿网址(例如https://www.slideshare.net/carologic/ai-and-machine-learning-demystified-by-carol-smith-at-midwest-ux-2017)
预期输出:Slideshare嵌入网址(在这种情况下:https://www.slideshare.net/slideshow/embed_code/key/wZudqqTdctjWXA)
我认为这将是使用google工作表获取输出的方法:= importxml(A1,“// meta [@ itemprop ='embedURL'] / @ content”)
它对我不起作用(无法获取网址)。有了Octoparse等,我只得到一个空白值。
毫无疑问,我在这里愚蠢。任何帮助都会有用。
它不起作用,因为slideshare由LinkedIN拥有,并且他们付出了很多努力以确保它们不能被删除,包括谷歌表。在它成为可能之前,但我相信他们最终能够继续努力。