はい、完全に無料です。あらゆるサイズのデータセットを変換でき、LLMファインチューニング用のトレーニングデータ準備、ログファイル処理、データエンジニアリングパイプラインに最適です。
いいえ。すべての変換はブラウザのローカルで行われます。機密データ、ユーザー情報、ビジネス記録を含む可能性のあるデータセットは、お使いのデバイス上で非公開のまま保持されます。
JSONL(JSON Lines、.jsonl)は、1行に1つの完全なJSONオブジェクトを格納し、改行で区切ります。この形式はJSON配列に比べていくつかの利点があります:(1) ストリーミング — ファイル全体をメモリに読み込むことなく1行ずつ処理できるため、数ギガバイトのデータセットに適しています。(2) 追記専用 — ファイル全体を書き換えることなく、ファイルの末尾に行を追記して新しいレコードを追加できます。(3) 耐障害性 — 破損した行はそのレコードにのみ影響し、ファイルの残りの部分は読み取り可能です(1つの構文エラーでファイル全体が壊れるJSON配列とは異なります)。(4) 並列処理 — 任意の行境界でJSONLファイルを分割し、チャンクを並列処理できます。JSONLは、OpenAIのファインチューニングデータセット、HuggingFaceデータセット、Webスクレイピングのエクスポート、ログ集約システムの標準形式です。CSVはフラットな構造を持つスプレッドシート互換データに適しており、JSON配列は小さな設定ファイルやAPIレスポンスに適しています。