python请求.status_code没有返回正确的值

问题描述 投票:1回答:3

看看这里的文档:http://docs.python-requests.org/en/latest/user/quickstart/

这应该打印200,它确实。

import requests
r = requests.get('http://souke.xdf.cn/Category/1-40-0-0.html?v=5&page=1&pagesize=50')
print r.status_code

这应该打印404但它打印200

import requests
r = requests.get('http://souke.xdf.cn/CategoryXXX/1-40-0-0.html?v=5&page=1&pagesize=50')
print r.status_code

这是为什么?

还有另一种方法来识别发生了404错误吗?

python web-scraping python-requests
3个回答
3
投票

问题不在于requests,而在于您访问的网站。它正在返回200

您可以使用Chrome开发人员工具查看标题来确认这一点:

Request URL:http://souke.xdf.cn/CategoryXXX/1-40-0-0.html?v=5&page=1&pagesize=50
Request Method:GET
Status Code:200 OK

0
投票

您正在寻找的页面位于服务器上,因此服务器响应200 OK。不过,您可以使用Requests的raise_for_status(),在发现服务器错误时引发异常,例如404,401等。

import requests

>>>>r = requests.get('http://something.com/404/')
>>>>print r.status_code
404
>>>>r.raise_for_status()
Traceback (most recent call last):
File "requests/models.py", line 832, in raise_for_status
raise http_error
requests.exceptions.HTTPError: 404 Client Error

0
投票
.raise_for_status()

如果不是200,这将引发错误

这比使用更好

.status_code
© www.soinside.com 2019 - 2024. All rights reserved.