欢迎使用 SkyPilot!#

SkyPilotSkyPilot

在任何基础设施上运行 AI — 统一、更快、更经济

收藏 关注

SkyPilot 是一个开源框架,用于在任何基础设施上运行 AI 和批量工作负载。

SkyPilot 对 AI 用户来说易于使用

  • 快速在您自己的基础设施上启动计算资源

  • 环境和作业即代码 — 简单且可移植

  • 轻松的作业管理:队列、运行和自动恢复大量作业

SkyPilot 统一了多个集群、云服务商和硬件

  • 一个接口即可使用预留 GPU、Kubernetes 集群或 16+ 云服务商

  • 灵活地配置 GPU、TPU、CPU,并具备智能故障转移

  • 团队部署和资源共享

SkyPilot 削减您的云成本并最大限度地提高 GPU 可用性

  • 自动停止:自动清理空闲资源

  • 支持 Spot 实例:节省 3-6 倍成本,并具备抢占自动恢复功能

  • 智能调度:自动在最便宜且最可用的基础设施上运行

SkyPilot 支持您现有的 GPU、TPU 和 CPU 工作负载,无需更改代码。

当前支持的基础设施:Kubernetes、AWS、GCP、Azure、OCI、Lambda Cloud、Fluidstack、RunPod、Cudo、Digital Ocean、Paperspace、Cloudflare、Samsung、IBM、Vast.ai、VMware vSphere、Nebius。

SkyPilot Supported Clouds SkyPilot Supported Clouds

准备好开始了吗?#

1 分钟内安装 SkyPilot。然后,在快速入门中在 2 分钟内启动您的第一个集群。

SkyPilot 是 BYOC(自带云):所有内容都在您的云账号、VPC 和集群内启动。

联系 SkyPilot 团队#

您可以在 SkyPilot Slack 上与 SkyPilot 团队和社区交流。

了解更多#

要了解更多信息,请参阅SkyPilot 概述SkyPilot 博客

案例研究和集成:社区焦点

关注更新

阅读研究成果