我一直在使用 Puppeteer 来抓取 LinkedIn 个人资料,但我一直面临着 LinkedIn 选择器定期更改的问题。变得有点累了。有谁有与网络抓取相关的解决方案或建议可以帮助克服这一挑战?
感谢任何建议或建议。
我正在使用使用 (.) 点运算符的类选择器
如果可能的话,尽量找一个稳定的锚点,比如ID选择器。然后利用您的经验以较少变化的方式定位元素。不要使用 CSS 选择器或工具自动生成的 XPath。
提取数据是网络抓取中最简单的部分。对于经常变化的网站来说,及时发现变化(或者说监控)是最重要的,而且修改一般都很简单。