[GCE(Google Compute Engine)GPU配额> = 1,但是启动VM失败

问题描述 投票:0回答:1

我当时在我的GCE项目中使用GPU,并决定要求将配额增加到2。我的VM实例1位于us-east1-c中,因此我导航至IAM&Admin> Quotas并选择了以下内容:服务-仅选择Compute Engine API公制-选定的NVIDIA P100 GPU和选定的NVIDIA p100虚拟工作站GPU位置-仅选择us-east1收到有关增加2个GPU的配额已获批准的通知后,我开始启动我的VM实例并收到错误代码:

enter image description here

我仔细检查了配额页面,并确认增加到2个GPU。Support @ google告诉我要对GPU Globaly提出要求,所以我提交了一个新请求,选择了所有选项,包括Global选项:

enter image description here

现在,当我尝试启动VM instance-1时,我得到:

enter image description here

因此错误消息显示我的配额为0.0,但是,在IAM和管理页面下查看我的配额,我在每个位置(包括us-east1(由于某些原因,除了europe-west3除外))的配额为2:

enter image description here

为了进行故障排除,我尝试在同一项目中的不同位置以及在新项目中使用GPU启动新的VM实例,但每次都会收到类似的错误消息。我已经使用此链接验证了选择的位置具有GPU的位置更令人困惑的是,没有人在我作为测试场开始的新项目中进行任何设置。配额全部为默认值1,我仍然收到错误消息。我在做什么错?

gpu google-compute-engine quota
1个回答
0
投票

除了请求增加该区域的配额外,您还需要请求全局配额增加。

类似于虚拟CPU配额,GPU配额是指一个区域中所有VM实例中虚拟GPU的总数。检查配额页面,以确保项目中有足够的可用GPU,并请求增加配额。 此外,新帐户和项目具有适用于所有区域的全局GPU配额。

当您请求GPU配额时,您必须为要在每个区域中创建的GPU模型请求配额,并为所有区域中所有类型的GPU总数提供一个额外的全局配额。] >

此过程记录在HERE

enter image description here您可以使用过滤器Location = Global来找到它

现在是该区域没有足够资源的第二个错误,如果看到“ ZONE_RESOURCE_POOL_EXHAUSTED”错误,意味着您在该特定区域遇到临时资源缺货问题,则应尝试在其他区域中进行部署

我建议您从该线程中删除第二张图像,因为您的项目ID可见

© www.soinside.com 2019 - 2024. All rights reserved.