跳到主要内容
回到顶部
Ctrl
+
K
您正在查看最新的开发者预览版文档。
点击此处
查看最新稳定版文档。
网站导航
文档
博客
社区
Slack
Twitter
GitHub
网站导航
文档
博客
社区
Slack
Twitter
GitHub
入门
概述
安装
快速入门
示例
快速入门: PyTorch
训练
Axolotl
DeepSpeed
分布式 PyTorch
分布式 TensorFlow
微调 Llama 3
微调 Llama 2
NeMo
Ray
在 TPU 上训练
Unsloth
Vertex AI
服务部署
vLLM
SGLang
Ollama
Hugging Face TGI
LoRAX
Cog
模型
DeepSeek-R1
DeepSeek-R1 Distilled
DeepSeek-Janus
Gemma 3
Llama 4
Llama 3.2
Llama 3.1
Llama 3
Llama 2
CodeLlama
Pixtral
Mixtral
Mistral 7B
Qwen 2.5
Yi
Gemma
DBRX
GPT-2 via llm.c
Vicuna
其他框架
Airflow
跨云数据传输
DVC
GCP DWS/Kueue
Jupyter
MLFlow
MPI
AI 应用
DeepSeek-R1 用于 RAG
大规模批量推理
图像向量数据库
Tabby: 编程助手
LocalGPT: 与 PDF 聊天
Stable Diffusion
AI 性能
AWS EFA
GCP GPUDirect-TCPX
概念: 天空计算
集群
启动一个开发集群
集群作业
计算资源调配
自动停止和自动关闭
作业
托管作业
多节点作业
多个并行作业
模型训练指南
模型服务部署
入门
服务部署用户指南
自动扩缩容
更新服务
授权
使用竞价实例进行服务部署
HTTPS 加密
基础设施选项
使用 Kubernetes
入门
Kubernetes 集群设置
部署指南
暴露服务
优先级和抢占
多个 Kubernetes 集群
SkyPilot 对比原生 Kubernetes
示例
动态工作负载调度器
Kueue
多区域 Kubernetes
Kubernetes 故障排除
使用现有机器
使用预留
使用云虚拟机
GPU 和加速器
使用 Google TPU
数据
云存储桶
同步代码和工件
用户指南
异步执行
密钥和环境变量
Docker 容器
打开端口
使用情况收集
常见问题
管理员指南
团队部署
部署 API 服务器
高级: 跨集群状态持久化
升级 API 服务器
性能最佳实践
故障排除
Helm Chart 参考
云账户和权限
AWS
GCP
Nebius
vSphere
Kubernetes
申请提升配额
管理员策略
参考资料
SkyPilot YAML
CLI
Python SDK
高级配置
配置来源
开发者指南
贡献 SkyPilot
指南: 添加新的云
AI 应用
#
DeepSeek-R1 用于 RAG
大规模批量推理
图像向量数据库
Tabby: 编程助手
LocalGPT: 与 PDF 聊天
Stable Diffusion
在 GitHub 上编辑