我正在用Python开发一个屏幕抓取工具。但是,当我查看网页源代码时,我注意到大部分数据都是通过 JavaScript 来的。
有什么想法,如何抓取基于 javascript 的网页吗? Python 有什么工具吗?
谢谢
使用 selenium 可以抓取基于 javascript 的网页。特别是,请尝试 Selenium WebDriver。
我使用 webkit,它是 Chrome 和 Safari 背后的浏览器渲染器。 Python 通过 Qt 绑定到 webkit。
这里是一个完整的Python 示例,用于执行 JavaScript 并提取最终的 HTML。