我知道这个问题很老了,但它也没有得到解答,而且自提出以来很多事情都发生了变化。 OpenAI 和 Azure Vision AI 技术可以很好地读取手写内容。两者都有 API 和简单的用户界面,无需太多努力即可测试功能。我刚刚向 ChatGPT 询问了以下问题并上传了示例图像。 “你能读一下这张发票并给我详细信息吗”。
尽管图像的分辨率非常低,但它给了我以下结果。我之前曾要求它在一个不相关的问题中给我 JSON 输出,所以它似乎假设我在这里想要它。
虽然不完美,但考虑到低质量的输入,这是一个相当不错的结果。
{
"Invoice": {
"Company": {
"Name": "NAVAYUG BYKES",
"Address": "Opp. Bescom, K.E.B. Road, Near S.S. Circle, Tumkur - 572 102.",
"Phone": "0816-4017462, 4015462",
"GSTIN": "29ADPPN8475L1ZF"
},
"Customer": {
"Name": "Shekar",
"Address": "RJS. 4. 2",
"Date": "13/11/19",
"Invoice_Number": "1631",
"Job_Card_No": "17988",
"Vehicle_No": "KA06NB3967"
},
"Items": [
{
"Sl_No": 1,
"Particulars": "Mark Sheild L Hand Rt",
"Labour": 0,
"Amount": 608
},
{
"Sl_No": 2,
"Particulars": "Front Disc Plate",
"Labour": 0,
"Amount": 1150
},
{
"Sl_No": 3,
"Particulars": "Cabure",
"Labour": 0,
"Amount": 1500
},
{
"Sl_No": 4,
"Particulars": "Visor Alon Key",
"Labour": 0,
"Amount": 59
}
],
"Total_Amount": 3317
}
}