使用 Azure AI Studio 创建数据源并连接到 Azure Blob 存储。转到聊天,选择来源并自动创建索引。我选择 1 次运行,它对数据进行索引,我可以通过 Playground 与它聊天。
请提供有关如何添加其他数据(将文件添加到现有路径或指向另一个 blob 路径)并重新使用相同索引重新索引的详细分步说明,最好通过 Azure AI 或 ML Studio UI,因此它仅更新现有索引,而无需重新处理所有文件。
另请解释如果设置计划而不是选择 1 个时间索引(它会重新运行)会发生什么情况。它会创建新版本的索引吗?它会更新现有索引吗?如果它更新索引,它是否知道文件是否被删除?现有索引是否重用现有数据或再次重新索引所有内容?
到目前为止,我已将新文件上传到现有的 Blob 存储,并且能够在数据源中创建指向同一 Blob 存储的新版本,并且可以在资源管理器中看到新文件。但我想再次手动更新现有索引,而不创建新索引。
是的,您可以重新运行索引器以将新文档添加到当前索引本身。
将文件上传到 blob 存储后,重新运行索引器或重置并重新运行以重新索引所有文档。
以下是我最初拥有的文档数量。
上传文档后,我重新运行并对新文档建立索引。
如果您重置并重新运行,则所有文档都将使用新文档重新索引。
它知道文件是否被删除吗?
是的,只有当您在数据源配置中勾选启用删除跟踪时,它才会识别已删除的文件并将其从索引中删除。您还应该 - 对 blob 启用软删除。
删除一个文档后,我重新运行索引器并成功删除它。
您可以在此处了解更多相关信息。