仅使用基于 LSTM 的模型进行 Tesseract 初始化

Question

我正在尝试制作一个可以识别匈牙利语图像中的文本的应用程序。我发现匈牙利训练数据文件仅适用于基于 LSTM 的识别。我的代码是：

    AssetHelper.Init(context);
    AssetHelper.extractAssets(context);
    TessBaseAPI tessBaseAPI = new TessBaseAPI();
    tessBaseAPI.init(AssetHelper.tessDataPath, "hun");
    tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_BLOCK);
    tessBaseAPI.setImage(AssetHelper.getImageBitmap(context));
    String data = tessBaseAPI.getUTF8Text();
    dataOutput.setText(data);
    tessBaseAPI.clear();
    tessBaseAPI.end();

我正在使用：

com.rmtheis:tess-two:9.1.0

我找不到任何有关如何准确将引擎设置为 LSTM 模式的信息。我刚刚收到错误：

2024-01-23 08:02:06.221 8422-8422 Tesseract(native) hu.androidtest.ocrproject E Could not initialize Tesseract API with language=hun!

如何使引擎进入 LSTM 模式，或者如何使用匈牙利数据运行应用程序？

编辑：我尝试了训练数据的所有 3 个版本（正常、快速、最佳）。

Answer 1

0
投票

最后我发现下载旧版本的训练数据是有效的。

仅使用基于 LSTM 的模型进行 Tesseract 初始化

问题描述投票：0回答：1

1个回答

最新问题

仅使用基于 LSTM 的模型进行 Tesseract 初始化

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1