Question 1

OCR とは何ですか?このツールは何をしますか?

Accepted Answer

OCR (光学文字認識) は、スキャンした PDF または写真内のテキストの画像を実際の選択可能な文字に変換します。このツールは、PDF または画像の各ページで OCR を実行し、抽出されたテキストを .txt ファイルとしてコピーまたはダウンロードします。

Question 2

私のファイルはサーバーにアップロードされていますか?

Accepted Answer

いいえ、認識は 100% ブラウザ内で行われるため、PDF や画像がデバイスの外に流出することはありません。ネットワークから取得されるのは Tesseract 言語モデル (トレーニング済みデータ) だけであり、これは一度ダウンロードされてキャッシュされます。

Question 3

どの言語がサポートされていますか?

Accepted Answer

最も一般的な 10 言語: 英語、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語、ヒンディー語、アラビア語、中国語 (簡体字)、ロシア語。最高の精度を得るために、抽出する前に文書に一致する言語を選択してください。

Question 4

手書き文字は読めるのでしょうか？

Accepted Answer

確実ではありません。 OCR は、印刷および入力されたテキスト用に設計されています。手書き、装飾フォント、非常に低解像度のスキャン、および傾いたページでは、不十分な結果または空の結果が生成されます。これは、このツールだけでなく OCR 自体の制限です。

Question 5

PDFだけでなく画像も扱えるのでしょうか？

Accepted Answer

はい。スキャンした PDF と一緒に、PNG または JPG 画像 (領収書、サイン、文書の写真など) をドロップし、同じ方法でそこからテキストを抽出できます。

Question 6

ページまたはファイルサイズの制限はありますか?

Accepted Answer

人為的なページ制限やサインアップはありません。複数ページの PDF を実行できます。スキャンが大きくなると認識に時間がかかるため、実質的な制限はデバイスのメモリと待機時間だけです。

Question 7

最も正確な結果を得るにはどうすればよいですか?

Accepted Answer

高解像度スキャン (300 DPI 以上) を使用し、ページがまっすぐで明るいことを確認し、正しいドキュメント言語を選択してください。きれいでコントラストの高い白地に黒のテキストが最もよく認識されます。

Question 8

これが iLovePDF OCR や onlineocr.net よりも優れている点は何ですか?

Accepted Answer

これらのツールはファイルをサーバーにアップロードし、多くの場合、サインアップやペイウォールの背後で言語、ページ、またはダウンロードをゲートします。このツールはデバイス上でファイルをプライベートに保ち、10 以上の言語をサポートし、PDF と画像の両方で動作し、サインアップやページ制限はありません。

OCR PDF

Recognition options