selenium浏览器驱动程序解码错误中文

Question

因为中文，浏览器解码页面源错误，我无法通过Python enter image description here解码到正确的内容

但对于浏览器，它显示正确...

如何解码页面源以获取正确的内容？

这是我的代码：


from selenium import webdriver

driver = webdriver.Chrome("/home/ug/Desktop/bin/chromedriver")

# the url is the `api url`       
driver.get("http://data.stats.gov.cn/easyquery.htm?m=QueryData&dbcode=fsjd&rowcode=zb&colcode=sj&wds=%5B%7B%22wdcode%22%3A%22reg%22%2C%22valuecode%22%3A%22350000%22%7D%5D&dfwds=%5B%5D&k1=1555920886106")

driver.page_source

Answer 1

我通过执行javascript来解决这个问题。

首先，我使用driver.get("http://data.stats.gov.cn")，接下来，driver.execute_script('$.ajax...')，并将返回设置为页面内容，

现在，页面源被正确解码了......

我认为这是ajax工作

selenium浏览器驱动程序解码错误中文

问题描述投票：0回答：1

1个回答

最新问题

selenium浏览器驱动程序解码错误中文

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1