Google Cloud Vision API 是否检测 OCRed 文本中的格式，例如粗体、斜体、字体名称（helvetica 或 times new roman）等？

Question

敏捷的棕色狐狸跳过懒狗

在这种情况下，假设也有不同的字体系列，云视觉API可以检测到这一点。或者任何其他 OCR API 都能清楚地检测到这一点。 Tesseract 有能力，但它非常不准确。

Answer 1

谷歌云视觉 API 是否检测 OCRed 文本中的格式，例如粗体、斜体、字体名称（helvetica 或 times new roman）等？

不幸的是，没有。

在我的项目中，我使用ABBYY Cloud OCR SDK来实现此目的。如果您想尝试，可以开始免费试用，其中包括 500 个免费请求（页）。创建试用帐户后，您将收到 ABBYY 发送的电子邮件，其中包含您的应用程序 ID 和应用程序密码。使用这 2 个值根据 Authentication 创建您的身份验证标头。

请参阅以下示例：

执行 processImage 请求。在请求正文中传递您的图像。

要求：

POST / https://cloud.ocrsdk.com/v2/processImage?exportFormat=xml&profile=documentConversion&xml:writeFormatting=true
Authorization: <your token>

回应：

{
    "taskId": "a226a0b6-6705-4d6f-9f4c-517fa9b4e28e",
    "registrationTime": "2020-07-26T09:42:39Z",
    "statusChangeTime": "2020-07-26T09:42:39Z",
    "status": "Queued",
    "filesCount": 1,
    "requestStatusDelay": 10000
}

执行 getTaskStatus 请求以检查您的任务是否已完成。使用上一步响应中的taskId。

要求：

GET / https://cloud.ocrsdk.com/v2/getTaskStatus?taskId=a226a0b6-6705-4d6f-9f4c-517fa9b4e28e
Authorization: <your token>

回应：

{
    "taskId": "a226a0b6-6705-4d6f-9f4c-517fa9b4e28e",
    "registrationTime": "2020-07-26T09:42:39Z",
    "statusChangeTime": "2020-07-26T09:42:40Z",
    "status": "Completed",
    "filesCount": 1,
    "requestStatusDelay": 0,
    "resultUrls": [
        "https://ocrsdk.blob.core.windows.net/files/a226a0b6-6705-4d6f-9f4c-517fa9b4e28e.result?sv=2012-02-12&se=2020-07-26T19%3A00%3A00Z&sr=b&si=downloadResults&sig=4k9FcRoBfhodq%2BMj%2Ffj%2BGLBfwK2BsO7sj15JQOLcArk%3D"
    ]
}

下载结果（请参阅上一步响应中的 resultUrls）。

我用的是下面的图片并收到以下结果

Answer 2

ABBYY Cloud OCR 会非常准确，但最终，一切都取决于您的字体和扫描质量。

Answer 3

Google Cloud 的企业文档 OCR 产品具有用于字体样式检测的插件

Google Cloud Vision API 是否检测 OCRed 文本中的格式，例如粗体、斜体、字体名称（helvetica 或 times new roman）等？

问题描述投票：0回答：3

3个回答

最新问题

Google Cloud Vision API 是否检测 OCRed 文本中的格式，例如粗体、斜体、字体名称（helvetica 或 times new roman）等？

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3