使用Python从URL下载HTML页面

问题描述投票：1回答：1

我没有在网上找到任何方式。是否可以使用BeautifulSoup或类似内容从URL地址下载完整的HTML页面文件？

谢谢你的帮助。

python python-3.x web-scraping beautifulsoup

1个回答

2
投票

import requests

r = requests.get('http://example.com')

with open('example.html', 'wb') as f:
    f.write(r.content)

上面的块不会使用Javascript渲染任何内容。如果您需要Javascript渲染内容，那么您可以使用requests-html库（pip install requests-html）：

from requests_html import HTMLSession

session = HTMLSession()
r = session.get('http://example.com')

with open('example.html', 'wb') as f:
    f.write(r.content)

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.