申请提高配额#

大多数云服务商都会实施配额策略,以限制在特定区域可以存在的虚拟机实例数量。用户在配置资源时可能会遇到 QuotaExceededVcpuLimitExceeded 错误,特别是对于 H100/A100 等高端 GPU。要查看或提高您的配额限制,请按照以下说明进行。提交申请后,支持团队通常需要几天时间进行审核。为了增加获批机会,您可以回复他们的询问邮件,说明您的项目将如何使用这些申请的资源。

AWS#

  1. 前往 EC2 配额控制台

  2. 在右上角选择一个区域

  3. 从列表中选择一个 EC2 实例类型(例如,Running On-Demand P instancesAll P Spot Instance Requests)。使用 sky show-gpus --cloud aws --all在此处查看更多实例类型。

  4. 点击配额名称,然后选择申请提高配额

  5. 对于更改配额值,输入新值。

  6. 选择申请

Azure#

  1. 首先前往 Azure 的配额页面

  2. 选择屏幕顶部的申请增加

  3. 对于配额类型,选择 Compute-VM (cores-vCPUs) subscription limit increases。提示:请注意,可能会弹出一个消息“立即获取更多配额。您无需支持工单即可获得更多配额…”;请忽略它,因为大多数 GPU 实例的配额申请仍需要创建支持工单(后续步骤)。

  4. 选择下一步进入“附加详细信息”屏幕,然后选择输入详细信息

  • 在“配额详细信息”屏幕中

  • 对于“部署模型”,确保选中资源管理器

  • 对于“位置”,选择您要增加配额的所有区域。

  • 对于您选择的每个区域,从“配额”下拉列表中选择一个或多个 VM 系列。

  • 对于您选择的每个 VM 系列(例如,用于 H100 实例的 ND_H100_v5),输入您希望此订阅拥有的新 vCPU 限制。您可以在此处查看更多 VM 系列。

  • 完成后,选择保存并继续

  1. 输入或确认您的联系信息,然后选择下一步

  2. 最后,在“审核 + 创建”页面上确保所有信息正确无误,然后选择创建提交您的申请。

GCP#

  1. 在 Google Cloud Console 中,前往配额页面

  2. 点击过滤并选择 Service: Compute Engine API

  3. 对于 H100 GPU:选择 metric: GPUS_PER_GPU_FAMILY 并选择维度 gpu_family: NVIDIA_H100

  4. 对于所有其他 GPU:选择 Limit Name: instance_name。(例如,NVIDIA-V100-GPUS-per-project-region)。您可以查看计算 GPU 列表

  5. 选中您要更改配额的区域的复选框。

  6. 点击编辑配额并填写新的限制值。

  7. 点击提交申请

OCI#

  1. 前往 OCI 限制、配额和使用情况控制台 查看您当前的资源状态。

  2. 如果您想增加配额,点击页面上的申请提高服务限制链接。

  3. 从列表中选择一个服务类别(例如,Compute)。

  4. 从列表中选择一个资源(例如,GPUs for GPU.A10 based VM and BM Instances)。使用 sky show-gpus --cloud oci --all在此处查看更多实例类型。

  5. 限制字段中输入您的新限制值,并在申请原因中说明理由。

  6. 点击创建支持申请提交。

  7. 您可以查看OCI 服务限制了解更多信息。