在 AWS SageMaker 上编译 Tesseract OCR 时出现问题:GCC 版本和文件系统错误

问题描述 投票:0回答:1

我正在尝试在 AWS SageMaker (Amazon Linux 2) 上编译最新版本的 Tesseract OCR,以便我可以使用 PyMupdf OCR 功能。从源代码成功安装 Leptonica 1.85.0 后,我尝试编译 Tesseract。在make过程中,遇到如下错误:

``
src/api/baseapi.cpp:67:10: fatal error: filesystem: no such file or directory
#include <filesystem> // for std::filesystem
``

我使用 GCC 7.3.1(AWS 上的默认版本)并收到与标头相关的错误。我还尝试使用 PKG_CONFIG_PATH=/usr/local/lib/pkgconfig 导出 Leptonica 的正确路径,但问题仍然存在。

我尝试安装 libstdc++-devel 并使用 /usr/local/bin 中的 GCC,但没有解决问题。这是GCC版本的兼容性问题,还是缺少依赖项?在这个 SageMaker 环境中进行操作的最佳方法是什么?

任何有关如何解决此问题的建议将不胜感激!

python amazon-ec2 tesseract amazon-sagemaker pymupdf
1个回答
0
投票

您使用旧的编译器(构建 Tesseract 需要 c++17)。

© www.soinside.com 2019 - 2024. All rights reserved.