这并不是真正的“OCR”,因为它不识别字符,但它与应用于曲线的想法相同。 有人知道用于从(光栅)绘图图像检索值的图像处理库或已建立的算法吗? 例如,在这张图中,我很难用眼睛读取精确的值,因为网格线之间存在很大的间隙:
我可以使用直尺或其他东西,但它仍然容易出错。 如果有软件可以截取任何旧图表并自动将其转换为可以查询的值表或函数,那就太好了。
好像叫“曲线识别”? 也可用于从未发布基础数据的科学论文中的曲线中提取数据。
有一些人工指导也是可以的。 例如,OCR 没有理由无法读取“100”并将其与线条匹配,但在机器提取曲线相对于网格线的路径后,让人类给出线条数值是可以的。 我最感兴趣的是跟踪相对于网格的曲线的功能,即使网格倾斜、旋转或以非仿射方式扭曲。
更新:
现在有一篇维基百科文章,名为“将扫描的图形转换为数据”,链接中包含一堆软件。 还有一些 alternativeto.net 上的软件。 我想现在该理论属于 http://dsp.stackexchange.com,而软件解决方案属于 http://superuser.com?
图像是位图(仅像素)还是矢量(EMF、WMF、SVG、PS、PDF...)?矢量比像素好得多。我们处理矢量(包括 PDF),但不触及像素。我们的一些合作者会尝试使用像素,但仅限于最近的文档。