我在 Azure Blob 存储中有文档,我想用它来支持 AzureOpenAI Studio 中部署的 GPT-4 模型的响应。我已为 Blob 存储中的一些文档分配了一个元数据标记,称为
data_quality
。
我的想法是,AzureOpenAI - 与数据查询聊天的索引应优先从 data_quality
设置为高值的文档中提取内容,例如Gold
,或以其他方式依赖较低质量的数据(例如,Silver
、Under approval
等)。
我的问题是,当我将名为
data_quality
的自定义字段添加到索引,然后使用 Azure AI 搜索资源管理器时,该字段对于所有文档始终显示为 null
,即使是那些确实设置了值的文档。
如何成功将Azure Blob存储上的元数据标签映射到相应的字段?另外,创建此索引后,我是否必须将 AzureOpenAI 聊天的新实例连接到此 Azure AI 搜索索引,或者通过连接到 Blob 存储重新创建所有内容?
如果您为现有数据和索引添加了元数据标签,则需要再次运行索引器。
如果仍然得到空值,请尝试创建新索引,并在存储中添加元数据标签。
接下来,在 openai 中选择索引并添加数据源后,选中标记 使用自定义字段映射,然后单击下一步。
现在,您可以选择您的字段。 在
内容数据中选择
data_quality
,这样当您查询数据质量时,它就会给出相应的结果。
这里,我的元数据是
ragstatus
。
此外,请确保
data_quality
字段的类型为字符串,因为您只能在字段映射中配置字符串字段。