尝试在 MacOS 上的 Visual Studio 代码中探索在 PDF 上使用 Python 中的 Tabula。
import pandas as pd
import tabula
dfs = tabula.read_pdf("/Users/TEST.pdf", pages = 1)
len(dfs)
当我运行代码时,我收到以下错误:
FileNotFoundError:[Errno 2] 未找到 JVM DLL:/Library/Java/JavaVirtualMachines/adoptopenjdk-11.jdk/Contents/Home/lib/jli/libjli.dylib
我已经通过 home-brew 安装了 Java,并通过 pkg 显然都成功了,并且可以在 Visual Studio 代码中运行一个简单的 Java 程序。这样就安装好了,但是尽管尝试了几次,我还是不知道如何解决上述错误。
我对 python 和安装包都很陌生,所以如果你认为你可以回答,请像我 5 岁一样引导我。
更新:
import os
# Set the JAVA_HOME environment variable to the Java installation directory
os.environ["JAVA_HOME"] = "/opt/homebrew/opt/openjdk/libexec/openjdk.jdk"
import pandas as pd
import tabula
dfs = tabula.read_pdf("/Users/NickCoding/Desktop/TEST.pdf", pages = 1)
len(dfs)
这允许代码工作,但是我觉得这是一个拙劣的解决方案。
如何让它在虚拟环境中工作?
我遇到了同样的问题并找到了解决方案。
/usr/libexec/java_home -v 14