将 JSON 数组或 CSV 转换为 JSONL 格式
是的,完全免费。可转换任意大小的数据集,非常适合准备 LLM 微调的训练数据、处理日志文件以及数据工程管道。
不会。所有转换均在您的浏览器本地进行。您的数据集(可能包含专有数据、用户信息或业务记录)将保留在您的设备上,确保私密性。
JSONL(JSON Lines,.jsonl)每行存储一个完整的 JSON 对象,以换行符分隔。与 JSON 数组相比,这种格式有几个优势:(1) 流式处理 — 您可以逐行处理,无需将整个文件加载到内存中,适合数 GB 的数据集。(2) 仅追加 — 您可以通过在文件末尾追加行来添加新记录,无需重写整个数据集。(3) 容错性 — 损坏的行仅影响该记录;文件的其余部分仍可读取(不像 JSON 数组,单个语法错误会破坏整个文件)。(4) 并行处理 — 您可以在任意行边界处拆分 JSONL 文件并并行处理数据块。JSONL 是 OpenAI 微调数据集、HuggingFace 数据集、网络爬虫导出和日志聚合系统的标准格式。CSV 更适合具有扁平结构的电子表格兼容数据;JSON 数组更适合小型配置文件和 API 响应。