OCR PDF

Превратите отсканированные PDF-файлы и фотографии в выбираемый и копируемый текст прямо в браузере.

Drag & drop a scanned PDF or image here, or click to choose. OCR runs entirely in your browser — your file is never uploaded.

OCR PDF считывает отсканированные PDF-файлы и файлы изображений (PNG/JPG) и извлекает текст внутри них, чтобы вы могли копировать, редактировать и искать его. Распознавание полностью выполняется в вашем браузере с помощью Tesseract, поэтому ваш документ никогда не покидает ваше устройство — только языковая модель загружается один раз. Выберите английский, испанский, французский, немецкий, португальский, итальянский, хинди, арабский, китайский и русский языки, затем скопируйте результат или сохраните его в виде файла .txt. Для достижения максимальной точности используйте четкие сканы с высоким разрешением; печатный текст распознается гораздо лучше, чем рукописный.

Часто задаваемые вопросы

Что такое OCR и что делает этот инструмент?

OCR (оптическое распознавание символов) преобразует изображение текста в отсканированном PDF-файле или фотографии в реальные выбираемые символы. Этот инструмент запускает распознавание текста на каждой странице вашего PDF-файла или изображения и предоставляет вам извлеченный текст для копирования или загрузки в виде файла .txt.

Загружен ли мой файл на сервер?

Нет. Распознавание на 100% происходит внутри вашего браузера, поэтому ваш PDF-файл или изображение никогда не покидает ваше устройство. Единственное, что извлекается из сети, — это языковая модель Tesseract (обученные данные), которая загружается один раз и кэшируется.

Какие языки поддерживаются?

Десять наиболее распространенных языков: английский, испанский, французский, немецкий, португальский, итальянский, хинди, арабский, китайский (упрощенный) и русский. Прежде чем извлекать текст, выберите язык, соответствующий вашему документу, для обеспечения максимальной точности.

Может ли он читать почерк?

Не надежно. OCR предназначен для печатного и напечатанного текста. Рукописный ввод, декоративные шрифты, сканы с очень низким разрешением и перекошенные страницы приведут к плохим или пустым результатам — это ограничение самого OCR, а не только этого инструмента.

Это работает и с изображениями, а не только с PDF-файлами?

Да. Помимо отсканированных PDF-файлов вы можете добавить изображение PNG или JPG (например, фотографию квитанции, вывески или документа) и таким же образом извлечь из него текст.

Существует ли ограничение на размер страницы или файла?

Не существует искусственного ограничения количества страниц или регистрации. Вы можете запускать многостраничные PDF-файлы; Единственным практическим ограничением является объем памяти вашего устройства и время ожидания, поскольку распознавание более крупных сканирований занимает больше времени.

Как я могу получить наиболее точные результаты?

Используйте сканирование с высоким разрешением (300 точек на дюйм или более), убедитесь, что страница прямая и хорошо освещена, и выберите правильный язык документа. Чистый, высококонтрастный черно-белый текст распознается лучше всего.

Чем это лучше, чем iLovePDF OCR или onlineocr.net?

Эти инструменты загружают ваш файл на свои серверы и часто контролируют языки, страницы или загрузки после регистрации или платного доступа. Этот инструмент сохраняет конфиденциальность вашего файла на вашем устройстве, поддерживает более 10 языков, работает как с PDF-файлами, так и с изображениями, а также не имеет ограничений по регистрации или количеству страниц.