RAG 文档处理器 - Free Online Tool | PivaBox

为 RAG 流水线准备文档 — 使用可配置的分块策略、重叠和元数据

RAG 文档处理器 使用说明

  1. 将文档文本粘贴到输入区域 — 可以是文章、文档、转录稿或任何想为 RAG 系统准备的文本
  2. 选择分块策略(固定大小、按句子、按段落或递归分割),设置所需的块大小重叠,然后点击生成进行处理
  3. 查看生成的块及统计数据,点击任意块即可复制,或使用复制为 JSON / 复制为文本导出所有块

Frequently Asked Questions

RAG 文档处理器免费吗?

是的,PivaBox RAG 文档处理器完全免费使用。没有任何收费、订阅或隐藏费用。所有处理都在浏览器本地完成。

我的文档会上传到服务器吗?

不会。所有文本处理和分块都在你的浏览器中使用 JavaScript 完成。你的文档永远不会离开你的设备,确保内容私密安全。

我应该使用哪种分块策略?

通用文档使用<strong>递归分割</strong>,它会按层级尝试多种分隔符。叙事文本使用<strong>按句子</strong>,结构化文档使用<strong>按段落</strong>,需要精确字符级控制时使用<strong>固定大小</strong>。重叠有助于在块边界之间保持上下文。