这个问题在这里已有答案:
目前我正试图通过尝试重建Instagram机器人来尝试Python的第一步。
不幸的是,每次运行我的程序时都会收到错误:
语法错误:( unicode错误)'utf-8'编解码器无法解码位置23的字节0xe4:无效的连续字节
错误的代码行是:
like_button = lambda: driver.find_element_by_xpath('//span[@aria-label="Gefällt mir"]').click()
错误是由德语变音符号“ä”引起的,但我必须使用它,因为它是来自like按钮的xpath。
我已经google了,并且有解决方案将# - coding:utf-8 - 放在第一行。
不幸的是它没有帮助。
如果你能给我一些建议,那就太好了。
安托万
具有变音字符AFAIK的a在UTF8字符集中不可表示。 https://en.wikipedia.org/wiki/UTF-8
我会尝试使用ISO-8859-1作为编码。 https://www.ic.unicamp.br/~stolfi/EXPORT/www/ISO-8859-1-Encoding.html
您可以在代码的开头对页面内容进行编码:driver.find_element_by_tag_name('body')。get_attribute('innerHTML')。encode(“ISO-8859-1”)
或者,您可以在try / catch中编码元素,以尝试隔离特殊字符。