我在 Google Cloud Platform Vertex AI 上基于 Python 发行版和一些配置输入创建了一个自定义作业。例如:
这些输入的列表可以 JSON 格式在 Training 菜单中找到:
{
"workerPoolSpecs": [
{
"machineSpec": {
"machineType": "n1-standard-4"
},
"replicaCount": "1",
"diskSpec": {
"bootDiskType": "pd-standard",
"bootDiskSizeGb": 100
},
"pythonPackageSpec": {
"executorImageUri": "europe-docker.pkg.dev/vertex-ai/training/sklearn-cpu.1-0:latest",
"packageUris": [
"gs://my_bucket_for_vertexai/my_package_directory/trainer-0.1.tar.gz"
],
"pythonModule": "trainer.task"
}
}
],
"baseOutputDirectory": {
"outputUriPrefix": "gs://my_bucket_for_vertexai/my_output_directory/"
}
}
我的作业如何自动检索这些参数,而无需将它们的值写入 Python 代码中?
您可以使用
aiplatform.CustomJob.get(job_id)
检索显示的 JSON。 这个答案展示了如何获取工作 ID。唯一的问题是,我不确定这些资源是否是在容器运行之前创建的,以便容器可以访问它们..