在我的Python 3程序中,我遇到了奇怪的编码字符串,例如“ abol%C3%A2t”(abolât)和“%C5%93ufs”(œufs)。我从WiktionaryParser获得它们。
我只找到了将带引号的可打印字符串编码为UTF-8的方法,这里不是这种情况。如何将字符串从“%C3%A9vitables”更改为“évitables”?
这些字符串是Percent-encoded。使用urllib.parse模块对其进行解码:
import urllib.parse
s = "%C5%93ufs"
s = urllib.parse.unquote(s)