使用 Python 登录抓取网页

问题描述 投票:0回答:0

我正在用 python 登录抓取一个 web 有一些问题来检测标头值,因为其中一些是隐藏的,而当我提交表单时它没有登录 web。 此代码在没有隐藏输入值的其他网络中工作。

我使用 Web 控制台寻找隐藏的输入值,尝试提交错误的登录表单,发现隐藏但仍然不起作用的标头的值。

我写的代码如下:

`import requests
from bs4 import BeautifulSoup

client = requests.Session()


login_information = {
    "rut": "xxxxx",
    "dv": 5,
    "referencia": "https://misiir.sii.cl/cgi_misii/siihome.cgi",
    "411": None,
    "rutcntr": "xxxxxx",
    "clave": "xxxxx",

}

client.post('https://zeusr.sii.cl//AUT2000/InicioAutenticacion/IngresoRutClave.html?https://misiir.sii.cl/cgi_misii/siihome.cgi', data=login_information)

html = client.get(
    "https://misiir.sii.cl/cgi_misii/siihome.cgi").content
soup = BeautifulSoup(html, 'html.parser')
print(soup)`

响应既不是日志记录也不是错误:( 我认为该帖子不起作用。

我还必须学习什么来解决这个问题?

python web-scraping post beautifulsoup
© www.soinside.com 2019 - 2024. All rights reserved.