Avez-vous déjà souhaité transformer une image (contenant du texte, que ce soit un poème ou une recette de cuisine) en véritable texte, que vous pourriez mettre en forme dans un logiciel de traitement de texte ?
Cette technologie est disponible depuis longtemps, généralement connue sous l’acronyme anglais OCR (pour Optical Character Recognition – ou Reconnaissance optique de caractères, en français).
Il nous a été demandé si un logiciel de ce type existe pour GNU/Linux. La réponse est évidemment « oui », et nous parlerons aujourd’hui de gImageReader.
Ce logiciel existe en deux versions différentes (« GTK » ou « Qt »), pour s’intégrer du mieux possible aux différents bureaux Linux existants.
La version « GTK » conviendra mieux aux bureaux Gnome (version 2 ou 3) ou Cinnamon (de Linux Mint) par exemple.
La version « Qt » quant à elle est destinée au bureau KDE Plasma (de Kubuntu par exemple).
Pour vérifier si gImageReader est bien disponible pour votre distribution Linux, vous pouvez ouvrir une fenêtre de Terminal (à noter que les commandes suivantes sont destinées aux distributions basées sur Debian, telles que Debian (bien sûr), Ubuntu ou Linux Mint – entre autres).
Puis tapez la commande suivante (terminez en appuyant sur la touche Entrée du clavier) :
apt list gimagereader*
Le résultat devrait ressembler à ceci :
gimagereader-common/stable,stable,now 3.4.1-1 all
gimagereader-qt5/stable,now 3.4.1-1 amd64
gimagereader-qt5/stable 3.4.1-1 i386
gimagereader/stable 3.4.1-1 amd64
gimagereader/stable 3.4.1-1 i386
Le paquet destiné aux bureaux de type « GTK » est gimagereader.
Celui destiné au bureau KDE Plasma (Qt) est gimagereader-qt5.
Pour installer la version « GTK », tapez la commande suivante (+ Entrée au clavier) :
sudo apt install gimagereader
Et pour la version « Qt » :
sudo apt install gimagereader-qt5
Il est ensuite nécessaire d’installer un paquet linguistique correspondant à la langue dont vous souhaitez reconnaître le texte. Pour afficher toutes les langues prises en charge, tapez la commande suivante :
apt list tesseract-ocr-*
La liste est longue… mais sachez que pour installer le paquet destiné à la langue Française, il vous faudra exécuter la commande suivante :
sudo apt install tesseract-ocr-fra
Une fois les deux paquets installés (logiciel + paquet linguistique), vous devriez trouver le logiciel gImageReader dans la liste des logiciels disponibles sur votre PC (ouvrez le menu des applications – gImageReader est généralement présent dans la catégorie Graphisme).
Si vous ne parvenez pas à le trouver, vous pouvez néanmoins exécuter le logiciel dans la fenêtre de Terminal avec cette commande :
gimagereader-gtk
ou
gimagereader-qt5
Pour vous aider à appréhender le fonctionnement de gImageReader, voici un petit tutoriel concocté par notre associée Saka :
Nous vous souhaitons « bonne reconnaissance optique » ! Et n’hésitez pas à nous solliciter (via notre formulaire de contact) en cas de difficulté.
Librement vôtre ! <3