画像からテキストを認識
はい、完全に無料です。ページ数の制限、サブスクリプション料金、アカウント登録の必要はありません。必要なだけ多くの画像からテキストを抽出できます。
いいえ。すべてのOCR処理は、Tesseract.js(WebAssemblyにコンパイル)を使用してブラウザ内で完全に実行されます。画像と抽出されたテキストが端末から外部に送信されることはないため、機密文書、身分証明書、医療記録、または独自コンテンツにとって重要です。
最適なOCR結果を得るために:(1) 照明が適切で、テキストと背景のコントラストが高い画像を使用します。白または明るい背景に黒いテキストが最適です。(2) 解像度は少なくとも200~300 DPIを目指します。(3) テキストを水平に揃えます。傾いたり回転したりしたテキストは精度が低下します。(4) 処理前に正しい言語を選択します。(5) 清潔で印刷されたフォントは、手書きや装飾的なスクリプトよりも正確に認識されます。(6) 処理前にスキャンした文書からノイズ、影、斑点を除去します。ソースが多ページPDFの場合は、まずPDF画像抽出ツールを使用して各ページを画像として抽出し、その後OCR処理を行います。