# 向量存储 / RAG

使用检索增强生成提升AI的知识能力。


# 📚 功能介绍

RAG(Retrieval-Augmented Generation)让AI能够:

  • 检索相关文档
  • 基于文档回答问题
  • 扩展知识范围
  • 提供有依据的回复

# 🗂️ Collections(集合)

# 创建集合

  1. 进入 设置 → 向量存储
  2. 点击 "新建集合"
  3. 命名集合
  4. 添加文档

# 添加文档

支持的格式:

  • 纯文本 (.txt)
  • Markdown (.md)
  • PDF(部分支持)

# ✂️ 文档分块

文档会被分割成小块以便检索:

策略 说明
固定大小 按字符/Token数分割
句子 按句子边界分割
段落 按段落分割

# 推荐设置

  • 块大小:200-500 tokens
  • 重叠:10-20%

# 🔍 相似度搜索

当用户发送消息时:

  1. 消息被转换为向量
  2. 搜索最相关的文档块
  3. 将相关内容注入上下文
  4. AI基于这些内容回复

# 🎯 提示词集成

# 自动注入

开启后,相关文档会自动添加到提示词中。

# 注入位置

可以选择注入位置:

  • 系统提示后
  • 用户消息前
  • 自定义位置

# 检索数量

设置检索多少个相关块:

  • 推荐:3-5个
  • 过多可能占用上下文

# 📤 导入/导出

# 导出集合

以JSON格式导出,包含:

  • 文档内容
  • 向量索引
  • 配置信息

# 导入集合

从JSON文件恢复集合。


# 💡 使用场景

为角色创建专属知识库,让AI能准确回答角色相关问题。

大量世界观设定可以存入向量库,按需检索。

存储故事大纲和章节,AI能保持一致性。


# ⚠️ 注意事项

  • 向量计算需要时间
  • 大量文档会占用存储
  • 检索质量影响回答质量

返回功能列表
../