在 Python 中抓取基于 Javascript 的网页

问题描述 投票:0回答:3

我正在用Python开发一个屏幕抓取工具。但是,当我查看网页源代码时,我注意到大部分数据都是通过 JavaScript 来的。

有什么想法,如何抓取基于 javascript 的网页吗? Python 有什么工具吗?

谢谢

python web-scraping beautifulsoup
3个回答
5
投票

使用 selenium 可以抓取基于 javascript 的网页。特别是,请尝试 Selenium WebDriver


4
投票

我使用 webkit,它是 Chrome 和 Safari 背后的浏览器渲染器。 Python 通过 Qt 绑定到 webkit。

这里是一个完整的

Python 示例,用于执行 JavaScript 并提取最终的 HTML


3
投票
您可以使用

PyQt4库的QtWebKit模块

© www.soinside.com 2019 - 2024. All rights reserved.