JSONL 转换器 - Free Online Tool | PivaBox

将 JSON 数组或 CSV 转换为 JSONL 格式

JSONL 转换器 — 在线实现 JSONL、JSON 数组与 CSV 格式互转

  1. 将您的 JSONL(JSON Lines)数据、JSON 数组或 CSV 粘贴到输入面板中。JSONL 是一种每行都是一个完整、有效 JSON 对象的格式,常用于大型数据集、日志文件和 LLM 训练数据。
  2. 选择转换方向:JSONL → JSON 数组(将所有对象包裹在 [] 中并用逗号分隔)、JSONL → CSV(将对象展平为表格格式)、JSON 数组 → JSONL(将数组拆分为每行一个对象)或 CSV → JSONL。转换器会验证每一行,并报告带有行号的错误。
  3. 复制或下载转换后的输出。JSONL 是流式处理大型数据集的首选格式,因为每一行都可以独立解析,而不像 JSON 数组那样必须完全加载到内存中。

Frequently Asked Questions

JSONL 转换器是免费的吗?

是的,完全免费。可转换任意大小的数据集,非常适合准备 LLM 微调的训练数据、处理日志文件以及数据工程管道。

我的数据会被上传到任何地方吗?

不会。所有转换均在您的浏览器本地进行。您的数据集(可能包含专有数据、用户信息或业务记录)将保留在您的设备上,确保私密性。

什么是 JSONL?什么时候应该使用它而不是 JSON 数组或 CSV?

JSONL(JSON Lines,.jsonl)每行存储一个完整的 JSON 对象,以换行符分隔。与 JSON 数组相比,这种格式有几个优势:(1) 流式处理 — 您可以逐行处理,无需将整个文件加载到内存中,适合数 GB 的数据集。(2) 仅追加 — 您可以通过在文件末尾追加行来添加新记录,无需重写整个数据集。(3) 容错性 — 损坏的行仅影响该记录;文件的其余部分仍可读取(不像 JSON 数组,单个语法错误会破坏整个文件)。(4) 并行处理 — 您可以在任意行边界处拆分 JSONL 文件并并行处理数据块。JSONL 是 OpenAI 微调数据集、HuggingFace 数据集、网络爬虫导出和日志聚合系统的标准格式。CSV 更适合具有扁平结构的电子表格兼容数据;JSON 数组更适合小型配置文件和 API 响应。