Ceci est une ancienne révision du document !


Tesseract OCR

# 20250604 Debian 12 @ tenko
sudo apt update
sudo apt install tesseract-ocr tesseract-ocr-fra tesseract-ocr-eng
tesseract --version # tesseract 5.3.0 + leptonica-1.82.0

Tesseract ne lit pas le format pdf en entrée, mais on peut passer par convert

convert -density 300 page.pdf page.png && tesseract page.png page -l fra 
  • ressource/logiciel/tesseract/start.1749042918.txt.gz
  • Dernière modification: 2025/06/04 15:15
  • par emoc