databricks 在工作流/作业中使用服务主体 + 远程存储库

问题描述 投票:0回答:0

我想创建一个所有者设置为服务主体的数据块作业。主要原因是,如果人们离开公司,没有什么可以改变的,也不会因为 PAT 失败或类似情况而导致工作中断。 问题是这样做时,作业总是无法访问设置为 azure devops 远程回购的代码。问题和错误消息表明服务主体无法克隆 git 存储库。

我怎样才能完成这项工作?

我的理解是,我可以使用数据块中的 git-credentials api 让服务主体使用我的 PAT 令牌之一来访问 git。 https://docs.databricks.com/dev-tools/api/latest/gitcredentials.html#operation/create-git-credential

我知道一个解决方法是构建 wheel 并发布它,这样“检查代码”不是由工作完成,而是由 CI/CD 预先完成。但由于远程回购非常简单易行,我们也希望将此功能与服务主体一起使用。

有人用过它并使它起作用吗?也许还有允许服务主体访问 azure devops 本身的选项,但我被告知这还不可能。

azure azure-devops databricks
© www.soinside.com 2019 - 2024. All rights reserved.