跳到主要内容
Ctrl+K

您正在查看最新的开发者预览版文档。 点击此处 查看最新稳定版文档。

站点导航

  • 文档
  • 博客
  • 社区
  • Slack
  • Twitter
  • GitHub

站点导航

  • 文档
  • 博客
  • 社区
  • Slack
  • Twitter
  • GitHub

入门

  • 概述
  • 安装
  • 快速入门
  • 示例
    • 快速入门:PyTorch
    • 训练
      • Axolotl
      • DeepSpeed
      • 分布式 PyTorch
      • 分布式 TensorFlow
      • 微调 Llama 3
      • 微调 Llama 2
      • NeMo
      • Ray
      • 在 TPU 上进行训练
      • Unsloth
      • Vertex AI
    • 服务
      • vLLM
      • SGLang
      • Ollama
      • Hugging Face TGI
      • LoRAX
      • Cog
    • 模型
      • DeepSeek-R1
      • DeepSeek-R1 Distilled
      • DeepSeek-Janus
      • Gemma 3
      • Llama 4
      • Llama 3.2
      • Llama 3.1
      • Llama 3
      • Llama 2
      • CodeLlama
      • Pixtral
      • Mixtral
      • Mistral 7B
      • Qwen 2.5
      • Yi
      • Gemma
      • DBRX
      • 通过 llm.c 使用 GPT-2
      • Vicuna
    • 其他框架
      • Airflow
      • 跨云数据传输
      • DVC
      • GCP DWS/Kueue
      • Jupyter
      • MLFlow
      • MPI
    • AI 应用
      • 用于 RAG 的 DeepSeek-R1
      • 大规模批量推理
      • 图像向量数据库
      • Tabby:编程助手
      • LocalGPT:与 PDF 聊天
      • Stable Diffusion
    • AI 性能
      • AWS EFA
      • GCP GPUDirect-TCPX
  • 概念:Sky Computing

集群

  • 启动开发集群
  • 集群作业
  • 配置计算资源
  • 自动停止和自动关闭

作业

  • 托管作业
  • 多节点作业
  • 并行运行大量作业
  • 模型训练指南

模型服务

  • 入门
  • 服务用户指南
    • 自动扩缩
    • 更新服务
    • 授权
    • 使用 Spot 实例进行服务
    • HTTPS 加密

基础设施选择

  • 使用 Kubernetes
    • 入门
    • Kubernetes 集群设置
      • 部署指南
      • 暴露服务
    • 优先级和抢占
    • 多个 Kubernetes 集群
    • SkyPilot 对比原生 Kubernetes
    • 示例
      • 动态工作负载调度器
      • Kueue
      • 多区域 Kubernetes
    • Kubernetes 故障排除
  • 使用现有机器
  • 使用预留实例
  • 使用云虚拟机
  • GPU 和加速器
    • 使用 Google TPU

数据

  • 云存储桶
  • 同步代码和 Artifacts

用户指南

  • 异步执行
  • 密钥和环境变量
  • Docker 容器
  • 开放端口
  • 使用情况收集
  • 常见问题

管理员指南

  • 团队部署
    • 部署 API 服务器
      • 高级:跨集群状态持久化
    • 升级 API 服务器
    • 性能最佳实践
    • 故障排除
    • Helm Chart 参考
  • 云账号和权限
    • AWS
    • GCP
    • Nebius
    • vSphere
    • Kubernetes
  • 申请配额增加
  • 管理员策略

参考资料

  • SkyPilot YAML
  • CLI
  • Python SDK
  • 高级配置
    • 配置来源
  • 开发者指南
    • 贡献 SkyPilot
    • 指南:添加新的云

服务用户指南#

  • 自动扩缩
    • 固定副本数
    • 启用自动扩缩
    • 扩缩延迟
    • 缩容到零
  • 更新服务
    • 滚动更新
      • 示例
    • 蓝绿更新
      • 示例
  • 授权
    • 设置 API 密钥
  • 使用 Spot 实例进行服务
    • 基础按需回退
    • 动态按需回退
    • 示例
  • HTTPS 加密
    • HTTPS 加密端点

上一页

模型服务

下一页

自动扩缩

在 GitHub 上编辑

© 版权所有 2025, SkyPilot 团队。