我正在尝试制作一个可以识别匈牙利语图像中的文本的应用程序。我发现匈牙利训练数据文件仅适用于基于 LSTM 的识别。我的代码是:
AssetHelper.Init(context);
AssetHelper.extractAssets(context);
TessBaseAPI tessBaseAPI = new TessBaseAPI();
tessBaseAPI.init(AssetHelper.tessDataPath, "hun");
tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_BLOCK);
tessBaseAPI.setImage(AssetHelper.getImageBitmap(context));
String data = tessBaseAPI.getUTF8Text();
dataOutput.setText(data);
tessBaseAPI.clear();
tessBaseAPI.end();
我正在使用:
com.rmtheis:tess-two:9.1.0
我找不到任何有关如何准确将引擎设置为 LSTM 模式的信息。我刚刚收到错误:
2024-01-23 08:02:06.221 8422-8422 Tesseract(native) hu.androidtest.ocrproject E Could not initialize Tesseract API with language=hun!
如何使引擎进入 LSTM 模式,或者如何使用匈牙利数据运行应用程序?
编辑:我尝试了训练数据的所有 3 个版本(正常、快速、最佳)。
最后我发现下载旧版本的训练数据是有效的。