我目前正在使用 Google 的文档 AI 构建自定义 OCR 提取器,我的文档通常约为 8-14 页长,并且我已经在所有可能的页面上创建了一个架构。使用定义的架构,我开始在导入文档的所有页面上手动注释。然而,当我评估我的模型时,似乎该模型只能准确注释/预测第一页上的标签。有谁知道这个问题的原因是什么?非常感谢!
** 我将详细介绍我的注释方式,也许这就是导致我出现此问题的原因。因此,我有大约 40 个标签,文档的每页使用大约 5-15 个标签,具体取决于每页内容的类型。我标记的方式是注释该特定页面上存在的标签。例如,第 1 页有 company_name、company_address、company_type,因此我只对它们进行标记,而将其他 30 个左右的标签留空,然后转到下一页。这是正确的吗?或者我在这一步中遗漏了什么?
我确实有这个疑问,你得到答案了吗?