OCRmyPDF 15 lançado com várias melhorias de desempenho

E foi lançado o OCRmyPDF 15 com várias melhorias de desempenho. Confira as novidades dessa atualização e veja como instalar no Linux.

O OCRmyPDF adiciona uma camada de texto OCR aos arquivos PDF digitalizados, permitindo que eles sejam pesquisados ou copiados e colados.

Principais características do OCRmyPDF:

Gera um arquivo PDF/A pesquisável a partir de um PDF normal
Coloca o texto OCR com precisão abaixo da imagem para facilitar a cópia/cola
Mantém a resolução exata das imagens incorporadas originais
Quando possível, insere informações de OCR como uma operação “sem perdas” sem interromper qualquer outro conteúdo
Otimiza imagens PDF, muitas vezes produzindo arquivos menores que o arquivo de entrada
Se solicitado, enquadra e/ou limpa a imagem antes de executar o OCR
Valida arquivos de entrada e saída
Distribui o trabalho em todos os núcleos de CPU disponíveis
Usa o mecanismo Tesseract OCR para reconhecer mais de 100 idiomas
Mantém seus dados privados privados.
Dimensiona corretamente para lidar com arquivos com milhares de páginas
Testado em batalha em milhões de PDFs

Novidades do OCRmyPDF 15

OCRmyPDF 15 lançado com várias melhorias de desempenho

Uma grande atualização do OCRmyPDF já está disponível, o projeto de código aberto que pode funcionar em PDFs digitalizados e outros documentos PDF para adicionar uma camada de texto de reconhecimento óptico de caracteres (OCR) aos arquivos para permitir que eles sejam pesquisados ou copiados e colados.

O OCRmyPDF facilita muito o trabalho com arquivos de texto PDF digitalizados e agora com o OCRmyPDF v15 é ainda melhor. Para completar, o OCRmyPDF 15 atualiza seus requisitos Python e várias dependências.

Esta versão também decidiu abandonar o suporte para Windows e Linux de 32 bits – agora apenas sistemas operacionais de 64 bits são suportados, com base no fato de que muitas de suas dependências passaram a ser apenas de 64 bits.

Além disso, o OCRmyPDF continua a usar o Tesseract como mecanismo de OCR.

OCRmyPDF 15 também traz várias melhorias de desempenho, atualizações para seu pacote Snap e corrige bugs decorrentes de PDFs onde apenas uma pequena parte de uma imagem em uma página representa um DPI/resolução mais alto.

Para saber mais sobre essa versão do OCRmyPDF 15, acesse a nota de lançamento.

Como instalar ou atualizar o OCRmyPDF

Para instalar a versão mais recente do OCRmyPDF nas principais distribuições Linux, use um dos comandos abaixo:

Sistema operacional	Commando de instalaçao
Debian, Ubuntu	`apt install ocrmypdf`
Windows Subsystem for Linux	`apt install ocrmypdf`
Fedora	`dnf install ocrmypdf`
macOS (Homebrew)	`brew install ocrmypdf`
macOS (nix)	`nix-env -i ocrmypdf`
LinuxBrew	`brew install ocrmypdf`
FreeBSD	`pkg install py-ocrmypdf`
Conda	`conda install ocrmypdf`
Ubuntu Snap	`snap install ocrmypdf`