我成功完成了本教程:Tesseract OCR iOS 教程。它使用 Tesseract OCR iOS 框架。
该应用程序与教程提供的示例图像配合得很好,但我自己测试的图像都不起作用(输出是乱码)。
为了排除故障,文档建议将配置变量
tessedit_write_images
切换到true
(或使用配置文件get.images
)来查看要处理的图像文件。但我不知道在哪里设置布尔值,并且不确定在哪里放置或如何使用配置文件。
在 Xcode 中的文件中搜索“tessedit_write_images”不会返回任何内容。
您可以通过提供命令行选项或在配置文件中设置配置变量
选项 1:使用命令行参数
$tesseract input.jpg output.txt --oem 2 -l eng -c tessedit_write_images=1
-c configvar=value
Set value for control parameter. Multiple -c arguments are allowed.
选项 2:使用配置文件 (myConfig)
$ tesseract Lord_Saraswathi.jpg text --oem 2 -l eng myConfig
$ cat myConfig
tessedit_write_images 1