文字相似度比較 - Free Online Tool | PivaBox

使用 Jaccard、Cosine TF 和 Levenshtein 三種方法比較兩段文字 — 視覺化詞語重疊、詞頻和相似度得分

如何使用文字相似度比較

  1. 將第一段文字貼上或輸入到文字 A,第二段文字貼上或輸入到文字 B
  2. 點擊計算相似度計算 Jaccard 重疊、Cosine TF 相似度和 Levenshtein 比率得分
  3. 探索詞語重疊視覺化、詞頻圖表和高亮的共有詞語,了解兩段文字之間的關係

Frequently Asked Questions

文字相似度比較是免費的嗎?

是的,PivaBox 文字相似度比較完全免費使用。所有計算均在瀏覽器本機執行 — 您的文字不會離開您的裝置。

Cosine TF 與 Jaccard 有何不同?

Jaccard 相似度只考慮詞語是否出現(有/無),對所有詞語一視同仁。Cosine TF 相似度使用詞頻資訊,因此在兩段文字中都出現 10 次的詞語比只出現 1 次的詞語貢獻更大的得分。Cosine TF 更好地近似語義相似度。

為什麼 Levenshtein 在字元級別工作?

Levenshtein 距離計算將一個字串轉換為另一個字串所需的最少單字元編輯次數(插入、刪除、替換)。它不理解詞語 — 將原始文字作為字元序列進行比較,非常適合捕捉拼寫錯誤、細微重寫和近似重複的字串。