为 RAG 流水线准备文档 — 使用可配置的分块策略、重叠和元数据
是的,PivaBox RAG 文档处理器完全免费使用。没有任何收费、订阅或隐藏费用。所有处理都在浏览器本地完成。
不会。所有文本处理和分块都在你的浏览器中使用 JavaScript 完成。你的文档永远不会离开你的设备,确保内容私密安全。
通用文档使用<strong>递归分割</strong>,它会按层级尝试多种分隔符。叙事文本使用<strong>按句子</strong>,结构化文档使用<strong>按段落</strong>,需要精确字符级控制时使用<strong>固定大小</strong>。重叠有助于在块边界之间保持上下文。