我有一个图像形式的文档。文档的内容是一些表格形式的信息。大多数情况下,这些是一些扫描文档,即黑白文档。但是,有时可能有原件,其中可能有蓝色印章或任何颜色的公司徽标(也许此信息对于解决我的问题很重要)。
重点是我想从文档中删除所有文本并只获得一个模板。下面是一个例子。
我得到的文件
我想得到结果
我并不是要求一个现成的解决方案(由您自行决定),我想听听您的意见、建议、关于如何实施的链接(以及是否可能)
我想我会使用 OpenCV 的霍夫线检测,获取坐标并在白色背景上绘制线条。
https://docs.opencv.org/3.4/d9/db0/tutorial_hough_lines.html
我认为这将是最干净的解决方案