OCR PDF

Transforme PDFs e fotos digitalizados em texto selecionável e copiável, diretamente no seu navegador.

Drag & drop a scanned PDF or image here, or click to choose. OCR runs entirely in your browser — your file is never uploaded.

OCR PDF lê PDFs digitalizados e arquivos de imagem (PNG/JPG) e extrai o texto dentro deles para que você possa copiá-los, editá-los e pesquisá-los. O reconhecimento é executado inteiramente no seu navegador usando o Tesseract, para que seu documento nunca saia do seu dispositivo – apenas o modelo de idioma é baixado uma vez. Escolha entre inglês, espanhol, francês, alemão, português, italiano, hindi, árabe, chinês e russo e copie o resultado ou salve-o como um arquivo .txt. Para melhor precisão, use digitalizações nítidas e de alta resolução; o texto impresso reconhece muito melhor do que a escrita à mão.

Perguntas frequentes

O que é OCR e o que esta ferramenta faz?

OCR (reconhecimento óptico de caracteres) converte a imagem do texto em um PDF ou foto digitalizada em caracteres reais e selecionáveis. Esta ferramenta executa OCR em cada página do seu PDF ou imagem e fornece o texto extraído para copiar ou baixar como um arquivo .txt.

Meu arquivo foi enviado para um servidor?

Não. O reconhecimento acontece 100% dentro do seu navegador, para que seu PDF ou imagem nunca saia do seu dispositivo. A única coisa obtida da rede é o modelo de linguagem Tesseract (dados treinados), que é baixado uma vez e armazenado em cache.

Quais idiomas são suportados?

Dez dos idiomas mais comuns: inglês, espanhol, francês, alemão, português, italiano, hindi, árabe, chinês (simplificado) e russo. Escolha o idioma que corresponde ao seu documento antes de extrair para obter melhor precisão.

Ele consegue ler caligrafia?

Não é confiável. OCR foi projetado para texto impresso e digitado. Caligrafia, fontes decorativas, digitalizações de resolução muito baixa e páginas distorcidas produzirão resultados ruins ou vazios – este é um limite do próprio OCR, não apenas desta ferramenta.

Funciona também em imagens, não apenas em PDFs?

Sim. Junto com os PDFs digitalizados, você pode inserir uma imagem PNG ou JPG (como a foto de um recibo, sinal ou documento) e extrair o texto dela da mesma maneira.

Existe um limite de tamanho de página ou arquivo?

Não há limite artificial de páginas ou inscrições. Você pode executar PDFs de várias páginas; o único limite prático é a memória do seu dispositivo e quanto tempo você deseja esperar, já que verificações maiores demoram mais para serem reconhecidas.

Como posso obter resultados mais precisos?

Use uma digitalização de alta resolução (300 DPI ou mais), certifique-se de que a página esteja reta e bem iluminada e selecione o idioma correto do documento. Texto em preto e branco limpo e de alto contraste é melhor reconhecido.

Como isso é melhor que o iLovePDF OCR ou onlineocr.net?

Essas ferramentas carregam seu arquivo para seus servidores e muitas vezes bloqueiam idiomas, páginas ou downloads por meio de inscrição ou acesso pago. Esta ferramenta mantém seu arquivo privado em seu dispositivo, suporta mais de 10 idiomas, funciona tanto em PDFs quanto em imagens e não tem inscrição ou limite de páginas.