是的,完全免費。無長度限制地清理無限文字——從短字串到整本小說長度的文件均可處理。
不會。所有文字處理均在您的瀏覽器本機完成。您的內容保持私密。
文字清理可解決實際的資料品質問題:(1) 多餘空白(多個空格、尾隨空格、空格與定位點混用)——從 PDF、電子郵件或網站複製時常見。(2) 不一致的換行符號(CR、LF、CRLF 混用)——不同作業系統的檔案使用不同的換行符號;將其標準化為您的平台標準。(3) 空行——資料匯出通常包含空白的分隔行;去除它們以壓縮資料。(4) 抓取文字中的 HTML 標籤——網頁抓取通常會留下 <p>、<br>、<div> 標籤;去除它們以獲得乾淨的純文字。(5) 智慧型引號和特殊字元——文書處理器會將直引號替換為「智慧型」彎引號,這可能會破壞程式碼和 CSV 剖析;將它們轉換為 ASCII 等效字元。(6) Unicode 標準化——某些字元有多種 Unicode 表示形式(例如,é 可以是單一字元 U+00E9,也可以是 e + 組合重音 U+0065 U+0301);標準化為 NFC 或 NFD 形式。在匯入資料庫、透過 NLP 管道執行或提交至版本控制之前,請先清理文字。