申请提高配额#

大多数云服务商都会实施配额策略，以限制在特定区域可以存在的虚拟机实例数量。用户在配置资源时可能会遇到 QuotaExceeded 或 VcpuLimitExceeded 错误，特别是对于 H100/A100 等高端 GPU。要查看或提高您的配额限制，请按照以下说明进行。提交申请后，支持团队通常需要几天时间进行审核。为了增加获批机会，您可以回复他们的询问邮件，说明您的项目将如何使用这些申请的资源。

AWS#

前往 EC2 配额控制台。
在右上角选择一个区域。
从列表中选择一个 EC2 实例类型（例如，Running On-Demand P instances 或 All P Spot Instance Requests）。使用 sky show-gpus --cloud aws --all 或在此处查看更多实例类型。
点击配额名称，然后选择申请提高配额。
对于更改配额值，输入新值。
选择申请。

Azure#

首先前往 Azure 的配额页面。
选择屏幕顶部的申请增加。
对于配额类型，选择 Compute-VM (cores-vCPUs) subscription limit increases。提示：请注意，可能会弹出一个消息“立即获取更多配额。您无需支持工单即可获得更多配额…”；请忽略它，因为大多数 GPU 实例的配额申请仍需要创建支持工单（后续步骤）。
选择下一步进入“附加详细信息”屏幕，然后选择输入详细信息。

在“配额详细信息”屏幕中

对于“部署模型”，确保选中资源管理器。

对于“位置”，选择您要增加配额的所有区域。

对于您选择的每个区域，从“配额”下拉列表中选择一个或多个 VM 系列。

对于您选择的每个 VM 系列（例如，用于 H100 实例的 ND_H100_v5），输入您希望此订阅拥有的新 vCPU 限制。您可以在此处查看更多 VM 系列。

完成后，选择保存并继续。

输入或确认您的联系信息，然后选择下一步。
最后，在“审核 + 创建”页面上确保所有信息正确无误，然后选择创建提交您的申请。

GCP#

在 Google Cloud Console 中，前往配额页面。
点击过滤并选择 Service: Compute Engine API。
对于 H100 GPU：选择 metric: GPUS_PER_GPU_FAMILY 并选择维度 gpu_family: NVIDIA_H100。
对于所有其他 GPU：选择 Limit Name: instance_name。（例如，NVIDIA-V100-GPUS-per-project-region）。您可以查看计算 GPU 列表。
选中您要更改配额的区域的复选框。
点击编辑配额并填写新的限制值。
点击提交申请。

OCI#

前往 OCI 限制、配额和使用情况控制台查看您当前的资源状态。
如果您想增加配额，点击页面上的申请提高服务限制链接。
从列表中选择一个服务类别（例如，Compute）。
从列表中选择一个资源（例如，GPUs for GPU.A10 based VM and BM Instances）。使用 sky show-gpus --cloud oci --all 或在此处查看更多实例类型。
在限制字段中输入您的新限制值，并在申请原因中说明理由。
点击创建支持申请提交。
您可以查看OCI 服务限制了解更多信息。