我想将 2679 页的 PDF 文件转换为 pandas dataframe,但出现此错误。我该如何修复它? 是不是因为页面太多导致的错误?
不要一次转换(所有)页面,选择特定的页面范围(例如 1-3)并循环执行,以便在循环结束时转换所有页面。
那是java告诉你内存不足..
所以,我知道这是一个老话题,但我找到了如何解决它,而且我对编程一无所知,所以它可能不起作用,我不知道。 在用 tabula 打开的 CMD 屏幕上查看并找到两个文件夹,即 java 的临时文件(我的文件类似于 user/appdata/local/temp,然后搜索“tabula”并删除所有内容),然后找到包含所有内容的文件夹您处理的 pdf (user/appdata/roaming/tabula/pdf) 并删除所有内容,这应该可以解决问题