Question 1

Что такое OCR и что делает этот инструмент?

Accepted Answer

OCR (оптическое распознавание символов) преобразует изображение текста в отсканированном PDF-файле или фотографии в реальные выбираемые символы. Этот инструмент запускает распознавание текста на каждой странице вашего PDF-файла или изображения и предоставляет вам извлеченный текст для копирования или загрузки в виде файла .txt.

Question 2

Загружен ли мой файл на сервер?

Accepted Answer

Нет. Распознавание на 100% происходит внутри вашего браузера, поэтому ваш PDF-файл или изображение никогда не покидает ваше устройство. Единственное, что извлекается из сети, — это языковая модель Tesseract (обученные данные), которая загружается один раз и кэшируется.

Question 3

Какие языки поддерживаются?

Accepted Answer

Десять наиболее распространенных языков: английский, испанский, французский, немецкий, португальский, итальянский, хинди, арабский, китайский (упрощенный) и русский. Прежде чем извлекать текст, выберите язык, соответствующий вашему документу, для обеспечения максимальной точности.

Question 4

Может ли он читать почерк?

Accepted Answer

Не надежно. OCR предназначен для печатного и напечатанного текста. Рукописный ввод, декоративные шрифты, сканы с очень низким разрешением и перекошенные страницы приведут к плохим или пустым результатам — это ограничение самого OCR, а не только этого инструмента.

Question 5

Это работает и с изображениями, а не только с PDF-файлами?

Accepted Answer

Да. Помимо отсканированных PDF-файлов вы можете добавить изображение PNG или JPG (например, фотографию квитанции, вывески или документа) и таким же образом извлечь из него текст.

Question 6

Существует ли ограничение на размер страницы или файла?

Accepted Answer

Не существует искусственного ограничения количества страниц или регистрации. Вы можете запускать многостраничные PDF-файлы; Единственным практическим ограничением является объем памяти вашего устройства и время ожидания, поскольку распознавание более крупных сканирований занимает больше времени.

Question 7

Как я могу получить наиболее точные результаты?

Accepted Answer

Используйте сканирование с высоким разрешением (300 точек на дюйм или более), убедитесь, что страница прямая и хорошо освещена, и выберите правильный язык документа. Чистый, высококонтрастный черно-белый текст распознается лучше всего.

Question 8

Чем это лучше, чем iLovePDF OCR или onlineocr.net?

Accepted Answer

Эти инструменты загружают ваш файл на свои серверы и часто контролируют языки, страницы или загрузки после регистрации или платного доступа. Этот инструмент сохраняет конфиденциальность вашего файла на вашем устройстве, поддерживает более 10 языков, работает как с PDF-файлами, так и с изображениями, а также не имеет ограничений по регистрации или количеству страниц.

OCR PDF

Recognition options

Часто задаваемые вопросы

Recognition options

Часто задаваемые вопросы

Сопутствующие инструменты

Сравнить PDF

Редактировать PDF

Извлечь изображение из PDF

Изображение в текст

Извлечение PDF-страниц

Добавить водяной знак в PDF