OCR PDF
Превратите отсканированные PDF-файлы и фотографии в выбираемый и копируемый текст прямо в браузере.
Drag & drop a scanned PDF or image here, or click to choose. OCR runs entirely in your browser — your file is never uploaded.
Recognition options
Private by design: the language model (trained data) is downloaded once from the CDN — your document stays on this device.
OCR PDF считывает отсканированные PDF-файлы и файлы изображений (PNG/JPG) и извлекает текст внутри них, чтобы вы могли копировать, редактировать и искать его. Распознавание полностью выполняется в вашем браузере с помощью Tesseract, поэтому ваш документ никогда не покидает ваше устройство — только языковая модель загружается один раз. Выберите английский, испанский, французский, немецкий, португальский, итальянский, хинди, арабский, китайский и русский языки, затем скопируйте результат или сохраните его в виде файла .txt. Для достижения максимальной точности используйте четкие сканы с высоким разрешением; печатный текст распознается гораздо лучше, чем рукописный.
Часто задаваемые вопросы
Что такое OCR и что делает этот инструмент?
OCR (оптическое распознавание символов) преобразует изображение текста в отсканированном PDF-файле или фотографии в реальные выбираемые символы. Этот инструмент запускает распознавание текста на каждой странице вашего PDF-файла или изображения и предоставляет вам извлеченный текст для копирования или загрузки в виде файла .txt.
Загружен ли мой файл на сервер?
Нет. Распознавание на 100% происходит внутри вашего браузера, поэтому ваш PDF-файл или изображение никогда не покидает ваше устройство. Единственное, что извлекается из сети, — это языковая модель Tesseract (обученные данные), которая загружается один раз и кэшируется.
Какие языки поддерживаются?
Десять наиболее распространенных языков: английский, испанский, французский, немецкий, португальский, итальянский, хинди, арабский, китайский (упрощенный) и русский. Прежде чем извлекать текст, выберите язык, соответствующий вашему документу, для обеспечения максимальной точности.
Может ли он читать почерк?
Не надежно. OCR предназначен для печатного и напечатанного текста. Рукописный ввод, декоративные шрифты, сканы с очень низким разрешением и перекошенные страницы приведут к плохим или пустым результатам — это ограничение самого OCR, а не только этого инструмента.
Это работает и с изображениями, а не только с PDF-файлами?
Да. Помимо отсканированных PDF-файлов вы можете добавить изображение PNG или JPG (например, фотографию квитанции, вывески или документа) и таким же образом извлечь из него текст.
Существует ли ограничение на размер страницы или файла?
Не существует искусственного ограничения количества страниц или регистрации. Вы можете запускать многостраничные PDF-файлы; Единственным практическим ограничением является объем памяти вашего устройства и время ожидания, поскольку распознавание более крупных сканирований занимает больше времени.
Как я могу получить наиболее точные результаты?
Используйте сканирование с высоким разрешением (300 точек на дюйм или более), убедитесь, что страница прямая и хорошо освещена, и выберите правильный язык документа. Чистый, высококонтрастный черно-белый текст распознается лучше всего.
Чем это лучше, чем iLovePDF OCR или onlineocr.net?
Эти инструменты загружают ваш файл на свои серверы и часто контролируют языки, страницы или загрузки после регистрации или платного доступа. Этот инструмент сохраняет конфиденциальность вашего файла на вашем устройстве, поддерживает более 10 языков, работает как с PDF-файлами, так и с изображениями, а также не имеет ограничений по регистрации или количеству страниц.