以此图为例
我尝试过 Ocr 网站,我尝试将其转换为 pdf,然后转换为 word,准备尝试使用 Paint,但这会花费我大量时间,所以我只是尝试翻译图像上的文本,其他任何内容都无需更改设计
当 PDF 具有带有文本的图像时,您在表面上看到的是像素,并且文本实际上是不可见的纯文本,没有任何制表符或其他位置信息,除了行开始的位置及其在空间中的空白偏移到下一个字符。
因此,如果我们假设源是此处强制执行的“蓝色”,那么除了第一个字符之外,任何“红色”翻译都不能被期望对齐。
所以明显的问题是像素是英语,而朗读文本对我来说都是希腊语,但对任何希腊读者来说都是音频垃圾。