跳至主要内容
返回顶部
Ctrl
+
K
您正在查看最新的开发者预览文档。请
点击此处
查看最新稳定版文档。
网站导航
文档
博客
社区
Slack
Twitter
GitHub
网站导航
文档
博客
社区
Slack
Twitter
GitHub
入门
概述
安装
快速入门
示例
快速入门:PyTorch
训练
Axolotl
DeepSpeed
分布式 PyTorch
分布式 TensorFlow
微调 Llama 3
微调 Llama 2
NeMo
Ray
在 TPU 上训练
Unsloth
Vertex AI
服务
vLLM
SGLang
Ollama
Hugging Face TGI
LoRAX
Cog
模型
DeepSeek-R1
DeepSeek-R1 Distilled
DeepSeek-Janus
Gemma 3
Llama 4
Llama 3.2
Llama 3.1
Llama 3
Llama 2
CodeLlama
Pixtral
Mixtral
Mistral 7B
Qwen 2.5
Yi
Gemma
DBRX
GPT-2 via llm.c
Vicuna
其他框架
Airflow
跨云数据传输
DVC
GCP DWS/Kueue
Jupyter
MLFlow
MPI
AI 应用
用于 RAG 的 DeepSeek-R1
大规模批量推理
图像向量数据库
Tabby:编码助手
LocalGPT:与 PDF 聊天
Stable Diffusion
AI 性能
AWS EFA
GCP GPUDirect-TCPX
概念:天空计算
集群
启动开发集群
集群作业
配置计算资源
自动停止和自动关闭
作业
托管作业
多节点作业
大量并行作业
模型训练指南
模型服务
入门
服务用户指南
自动扩缩容
更新服务
授权
使用 Spot 实例提供服务
HTTPS 加密
基础架构选择
使用 Kubernetes
入门
Kubernetes 集群设置
部署指南
暴露服务
优先级和抢占
多个 Kubernetes 集群
SkyPilot 对比原生 Kubernetes
示例
动态工作负载调度器
Kueue
多区域 Kubernetes
Kubernetes 故障排除
使用现有机器
使用预留实例
使用云虚拟机
GPU 和加速器
使用 Google TPU
数据
云存储桶
同步代码和工件
用户指南
异步执行
密钥和环境变量
Docker 容器
开放端口
使用情况收集
常见问题解答
管理员指南
团队部署
部署 API 服务器
高级:跨集群状态持久化
升级 API 服务器
性能最佳实践
故障排除
Helm Chart 参考
云账户和权限
AWS
GCP
Nebius
vSphere
Kubernetes
请求增加配额
管理员策略
参考
SkyPilot YAML
CLI
Python SDK
高级配置
配置源
开发者指南
贡献 SkyPilot
指南:添加新的云
Kubernetes 示例
#
动态工作负载调度器
Kueue
多区域 Kubernetes
在 GitHub 上编辑