欢迎使用 SkyPilot!#
在任何基础设施上运行 AI — 统一、更快、更经济
SkyPilot 是一个开源框架,用于在任何基础设施上运行 AI 和批量工作负载。
SkyPilot 对 AI 用户来说易于使用
快速在您自己的基础设施上启动计算资源
环境和作业即代码 — 简单且可移植
轻松的作业管理:队列、运行和自动恢复大量作业
SkyPilot 统一了多个集群、云服务商和硬件
SkyPilot 削减您的云成本并最大限度地提高 GPU 可用性
自动停止:自动清理空闲资源
支持 Spot 实例:节省 3-6 倍成本,并具备抢占自动恢复功能
智能调度:自动在最便宜且最可用的基础设施上运行
SkyPilot 支持您现有的 GPU、TPU 和 CPU 工作负载,无需更改代码。
当前支持的基础设施:Kubernetes、AWS、GCP、Azure、OCI、Lambda Cloud、Fluidstack、RunPod、Cudo、Digital Ocean、Paperspace、Cloudflare、Samsung、IBM、Vast.ai、VMware vSphere、Nebius。
准备好开始了吗?#
1 分钟内安装 SkyPilot。然后,在快速入门中在 2 分钟内启动您的第一个集群。
SkyPilot 是 BYOC(自带云):所有内容都在您的云账号、VPC 和集群内启动。
联系 SkyPilot 团队#
您可以在 SkyPilot Slack 上与 SkyPilot 团队和社区交流。
了解更多#
要了解更多信息,请参阅SkyPilot 概述和SkyPilot 博客。
案例研究和集成:社区焦点
关注更新
阅读研究成果
SkyPilot 论文和演讲 (NSDI 2023)
Sky Computing 愿景论文 (HotOS 2021)
SkyServe:跨区域和云的 AI 服务部署 (EuroSys 2025)
托管作业 Spot 实例策略 (NSDI 2024)