PDF OCR
Ubah PDF dan foto yang dipindai menjadi teks yang dapat dipilih dan disalin — langsung di browser Anda.
Drag & drop a scanned PDF or image here, or click to choose. OCR runs entirely in your browser — your file is never uploaded.
Recognition options
Private by design: the language model (trained data) is downloaded once from the CDN — your document stays on this device.
OCR PDF membaca PDF dan file gambar yang dipindai (PNG/JPG) dan mengekstrak teks di dalamnya sehingga Anda dapat menyalin, mengedit, dan mencarinya. Pengenalan berjalan sepenuhnya di browser Anda menggunakan Tesseract, sehingga dokumen Anda tidak pernah keluar dari perangkat — hanya model bahasa yang diunduh satu kali. Pilih dari bahasa Inggris, Spanyol, Prancis, Jerman, Portugis, Italia, Hindi, Arab, China, dan Rusia, lalu salin hasilnya atau simpan sebagai file .txt. Untuk akurasi terbaik, gunakan pemindaian yang jelas dan beresolusi tinggi; teks tercetak dapat dikenali jauh lebih baik daripada tulisan tangan.
Pertanyaan yang Sering Diajukan
Apa itu OCR dan apa fungsi alat ini?
OCR (pengenalan karakter optik) mengubah gambar teks dalam PDF atau foto yang dipindai menjadi karakter nyata yang dapat dipilih. Alat ini menjalankan OCR pada setiap halaman PDF atau gambar Anda dan memberi Anda teks yang diekstraksi untuk disalin atau diunduh sebagai file .txt.
Apakah file saya diunggah ke server?
Tidak. Pengenalan terjadi 100% di dalam browser Anda, jadi PDF atau gambar Anda tidak pernah keluar dari perangkat Anda. Satu-satunya hal yang diambil dari jaringan adalah model bahasa Tesseract (data terlatih), yang diunduh satu kali dan disimpan dalam cache.
Bahasa apa saja yang didukung?
Sepuluh bahasa yang paling umum: Inggris, Spanyol, Prancis, Jerman, Portugis, Italia, Hindi, Arab, China (Sederhana), dan Rusia. Pilih bahasa yang cocok dengan dokumen Anda sebelum mengekstraksi untuk akurasi terbaik.
Bisakah itu membaca tulisan tangan?
Tidak dapat diandalkan. OCR dirancang untuk teks yang dicetak dan diketik. Tulisan tangan, font dekoratif, pindaian beresolusi sangat rendah, dan halaman miring akan memberikan hasil yang buruk atau kosong — ini adalah batasan OCR itu sendiri, bukan hanya alat ini.
Apakah ini juga berfungsi pada gambar, bukan hanya PDF?
Ya. Selain PDF yang dipindai, Anda juga dapat melepaskan gambar PNG atau JPG (seperti foto tanda terima, tanda tangan, atau dokumen) dan mengekstrak teksnya dengan cara yang sama.
Apakah ada batasan ukuran halaman atau file?
Tidak ada batasan halaman atau pendaftaran buatan. Anda dapat menjalankan PDF multi-halaman; satu-satunya batasan praktis adalah memori perangkat Anda dan berapa lama Anda ingin menunggu, karena pemindaian yang lebih besar membutuhkan waktu lebih lama untuk dikenali.
Bagaimana saya bisa mendapatkan hasil yang paling akurat?
Gunakan pemindaian resolusi tinggi (300 DPI atau lebih), pastikan halaman lurus dan terang, dan pilih bahasa dokumen yang benar. Teks hitam-putih yang bersih dan kontras tinggi paling mudah dikenali.
Bagaimana ini lebih baik daripada iLovePDF OCR atau onlineocr.net?
Alat-alat tersebut mengunggah file Anda ke server mereka dan sering kali membatasi bahasa, halaman, atau unduhan di belakang pendaftaran atau paywall. Alat ini menjaga privasi file Anda di perangkat Anda, mendukung 10+ bahasa, berfungsi pada PDF dan gambar, dan tidak memiliki batasan pendaftaran atau halaman.