来自 tabula-java 的错误,CalledProcessError

问题描述 投票:0回答:2

我想将 2679 页的 PDF 文件转换为 pandas dataframe,但出现此错误。我该如何修复它? 是不是因为页面太多导致的错误?

您可以在下图中看到错误

java python pandas pdf tabula
2个回答
0
投票

不要一次转换(所有)页面,选择特定的页面范围(例如 1-3)并循环执行,以便在循环结束时转换所有页面。

那是java告诉你内存不足..

如何处理“java.lang.OutOfMemoryError: Java heap space”错误?


0
投票

所以,我知道这是一个老话题,但我找到了如何解决它,而且我对编程一无所知,所以它可能不起作用,我不知道。 在用 tabula 打开的 CMD 屏幕上查看并找到两个文件夹,即 java 的临时文件(我的文件类似于 user/appdata/local/temp,然后搜索“tabula”并删除所有内容),然后找到包含所有内容的文件夹您处理的 pdf (user/appdata/roaming/tabula/pdf) 并删除所有内容,这应该可以解决问题

© www.soinside.com 2019 - 2024. All rights reserved.