使用Python从URL下载HTML页面

问题描述 投票:1回答:1

我没有在网上找到任何方式。是否可以使用BeautifulSoup或类似内容从URL地址下载完整的HTML页面文件?

谢谢你的帮助。

python python-3.x web-scraping beautifulsoup
1个回答
2
投票
import requests

r = requests.get('http://example.com')

with open('example.html', 'wb') as f:
    f.write(r.content)

上面的块不会使用Javascript渲染任何内容。如果您需要Javascript渲染内容,那么您可以使用requests-html库(pip install requests-html):

from requests_html import HTMLSession

session = HTMLSession()
r = session.get('http://example.com')

with open('example.html', 'wb') as f:
    f.write(r.content)
© www.soinside.com 2019 - 2024. All rights reserved.