我有一个没有域名的网站,只能使用它的 IP 地址和端口访问(即:'http://1.1.1.1:111)。 我想抓取这个网站,因为我正在尝试访问它的一些信息。起初,我只是想发送一个“获取”请求,看看我是否能够访问该站点;但是当我打印响应的文本元素时,它是空的。请求的状态是200。看来请求无法加载网站。
import requests
with requests.session() as session:
response = session.get('http://1.1.1.1:1111')
with open('/index.html', 'w', encoding="utf-8") as f:
f.write(response.text)
作为测试,我尝试通过 url 抓取另一个网站(比如 https://google.com)。我向 url 发送了一个请求,打印了响应的文本,它正常地获取了网站上的内容;但它不适用于我的 IP 地址。
IP 地址在浏览器中正常工作,并加载其预期的网站。
我想知道我的代码是否有问题?或者我应该以不同于 url 的方式处理 IP 地址吗?
(我是网络抓取的新手,所以我对此有所了解) 提前致谢