[我正在使用python2.7和nltk处理从各个网站上抓取的内容的大型txt文件。但是我遇到各种unicode错误,例如
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 6: ordinal not in range(128)
我的问题不是我怎么能用python'解决'这个问题,而是在将'txt'文件馈送到python之前,我可以对.txt文件做任何事情(如格式化),例如'make plain text'完全避免这个问题?
尝试通过以下方式打开文件: