네, 완전히 무료입니다. 모든 크기의 데이터셋을 변환할 수 있으며, LLM 파인튜닝을 위한 학습 데이터 준비, 로그 파일 처리 및 데이터 엔지니어링 파이프라인에 이상적입니다.
아니요. 모든 변환은 브라우저에서 로컬로 이루어집니다. 독점 데이터, 사용자 정보 또는 비즈니스 기록이 포함될 수 있는 데이터셋은 기기에 비공개로 유지됩니다.
JSONL(JSON Lines, .jsonl)은 줄바꿈으로 구분하여 한 줄에 하나의 완전한 JSON 객체를 저장합니다. 이 형식은 JSON 배열에 비해 몇 가지 장점이 있습니다: (1) 스트리밍 — 전체 파일을 메모리에 로드하지 않고 한 줄씩 처리할 수 있어 수 기가바이트 규모의 데이터셋에 적합합니다. (2) 추가 전용 — 전체 데이터셋을 다시 쓰지 않고 파일 끝에 줄을 추가하여 새 레코드를 추가할 수 있습니다. (3) 내고장성 — 손상된 줄은 해당 레코드에만 영향을 미치며, 파일의 나머지 부분은 읽을 수 있는 상태로 유지됩니다(단일 구문 오류로 전체 파일이 손상되는 JSON 배열과 다름). (4) 병렬 처리 — 임의의 줄 경계에서 JSONL 파일을 분할하고 청크를 병렬로 처리할 수 있습니다. JSONL은 OpenAI 파인튜닝 데이터셋, HuggingFace 데이터셋, 웹 스크래핑 내보내기 및 로그 집계 시스템의 표준 형식입니다. CSV는 플랫 구조를 가진 스프레드시트 호환 데이터에 더 적합하고, JSON 배열은 소규모 구성 파일 및 API 응답에 더 적합합니다.