我想从pdf中提取,但pypdf2
没有提取所有信息,并且由于以下错误,textract
无法安装在3.7中:
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 1671: character maps to <undefined>
textract
下载https://pypi.python.org/pypi/textract的源文件pip3 install pdfminer3k
untar
下载的文件cd
进入目录python3 setup.py install
希望它适合你:)