Tesseract (logiciel)

Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache.

Tesseract

Informations
Développé par	Ray Smith (d)
Dernière version	5.2.0 (6 juillet 2022)[1]
Dépôt	github.com/tesseract-ocr/tesseract
Assurance qualité	Intégration continue
Écrit en	C++
Système d'exploitation	GNU/Linux, Microsoft Windows, macOS, BSD (d), GNU/Hurd (d), Android et iOS
Environnement	Linux, OpenBSD, Mac OS X, Windows
Formats lus	TIFF, Portable Network Graphics, JPEG File Interchange Format (JFIF), JP2 (d) et WebP
Formats écrits	HOCR (en), texte brut, Portable Document Format, ALTO (XML) et TSV
Type	OCR
Licence	Apache
Documentation	github.com/tesseract-ocr/tessdoc et tesseract-ocr.github.io
Site web	https://github.com/tesseract-ocr/tesseract

Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement. Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues.

Notes et références

« https://github.com/tesseract-ocr/tesseract/releases/tag/5.2.0 »

Liens externes

(en) Announcing Tesseract OCR (Luc Vincent, Google Code Blog, August 2006)

Portail des logiciels libres

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[wikidata-ef4104116df50336bdc76de564a03bd409034852-1] « https://github.com/tesseract-ocr/tesseract/releases/tag/5.2.0 »