源文件:llm/rag

基于 DeepSeek R1 的检索增强生成#

RAG with DeepSeek R1

有关完整的博客文章,请在此处查找。

步骤 0:设置环境#

安装以下先决条件

  • SkyPilot:确保 SkyPilot 已安装并且 sky check 成功。请参阅安装说明

设置用于存储嵌入和向量数据库的存储桶名称

export EMBEDDINGS_BUCKET_NAME=sky-rag-embeddings
export VECTORDB_BUCKET_NAME=sky-rag-vectordb

请注意,这些存储桶名称在整个 SkyPilot 社区中必须是唯一的。

步骤 2:使用向量数据库构建 RAG#

计算嵌入后,构建 ChromaDB 向量数据库以进行高效的相似性搜索

sky launch build_rag.yaml --env EMBEDDINGS_BUCKET_NAME=$EMBEDDINGS_BUCKET_NAME --env VECTORDB_BUCKET_NAME=$VECTORDB_BUCKET_NAME

该过程分批构建数据库

Loading embeddings from: embeddings_0_1000.parquet
Adding vectors to ChromaDB: 100%|██████████| 1000/1000 [00:12<00:00, 81.97it/s]
...

步骤 3:部署 RAG 服务#

部署 RAG 服务以处理查询并生成答案

sky launch -c legal-rag serve_rag.yaml --env VECTORDB_BUCKET_NAME=$VECTORDB_BUCKET_NAME

或者使用 Sky Serve 进行托管部署

sky serve up -n legal-rag serve_rag.yaml --env VECTORDB_BUCKET_NAME=$VECTORDB_BUCKET_NAME

要查询系统,获取端点

sky serve status legal-rag --endpoint

您可以访问网站并在其中输入您的查询!可以尝试以下几个查询

我想解除租赁合同。我的房东不允许我这样做。我的雇主在终止合同后没有提供最后的工资。

免责声明#

本文档提供了使用 SkyPilot 构建 RAG 系统的说明。本系统及其输出不应被视为法律建议。有关任何法律事务,请咨询合格的法律专业人士。

包含的文件#