La nouvelle distribution éducative pour débutants et initiés.

Vous n'êtes pas identifié(e).

Annonce

PRIMTUX3 i386 EST DISPONIBLE SUR SOURCEFORGE.
Somme MD5: 93ef32d6c63215a3dd015419bf456eac

#1 30-06-2017 21:23:02

ideefixe
Modérateur
Lieu : Bourges
Inscription : 04-06-2015
Messages : 2 211

OCR Tesseract pour PrimTux-Dys

Bonjour,

j'ai demandé de l'aide pour obtenir une solution de reconnaissance de caractères pour PrimTux-Dys,
sur le forum de AccessDV Linux.

ideefixe a écrit :

Bonjour  smile

Dans la présentation générale d'AccessDV Linux, je lis que le logiciel OCR intégré est Tesseract.
https://fr.wikipedia.org/wiki/Tesseract_(logiciel)

Suffit-il d'installer ce logiciel dans une Debian Jessie,
de scanner un document avec un appareil compatible,
pour que le texte s'affiche dans LibreOffice,
comme dans cette vidéo ?
https://www.youtube.com/watch?v=p08BT3piiNQ

Voulez-vous publier un tutoriel pour montrer comment installer les logiciels nécessaires à la machine à lire,
surtout pour sa fonction OCR ?

C'est pour aider des enfants dyslexiques, gratuitement.
http://wiki.primtux.fr/doku.php/primtux2-dys

Avec AcessDV Linux, les secrétaires risquent de gagner du temps, car il retranscrit sur - presque - n'importe quel logiciel de traitement de texte un document en moins de trois minutes.

http://www.ouest-france.fr/pays-de-la-l … re-4444594

Merci pour votre aide.

Cordialement

Hors ligne

#2 01-07-2017 07:24:03

Steph
Administrateur
Inscription : 03-06-2015
Messages : 3 867

Re : OCR Tesseract pour PrimTux-Dys

Le problème c'est que la reconnaissance passe par la ligne de commande...

Hors ligne

#3 02-07-2017 10:04:46

ideefixe
Modérateur
Lieu : Bourges
Inscription : 04-06-2015
Messages : 2 211

Re : OCR Tesseract pour PrimTux-Dys

Ector utilise Tesseract dans des scripts, ce qui permet d'augmenter la qualité de l'OCR, et de créer des outils simples à utiliser.

Si la qualité de l'image est bonne, le résultat est très bon, voici un exemple : https://www.youtube.com/watch?v=nrMteqXhT_Q

https://debian-facile.org/atelier:chant … seract-ocr

Hors ligne

#4 03-07-2017 22:02:30

ideefixe
Modérateur
Lieu : Bourges
Inscription : 04-06-2015
Messages : 2 211

Re : OCR Tesseract pour PrimTux-Dys

Une interface graphique pour Tesseract http://www.nplug.be/ocr

Le reconnaissance optique de caractères est possible sous Linux avec différents outils comme Tesseract et gImageReader.

Ce dernier étant une interface graphique "conviviale" pour Tesseract qui fonctionne habituellement uniquement en ligne de commande.

ocr:gimagereader-screenshot.png

Pour installer ces logiciels il faut lancer dans un terminal les commandes suivantes:
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader-gtk tesseract-ocr tesseract-ocr-fra tesseract-ocr-eng

Cette procédure fonctionne pour Ubuntu 14.04-16.06 et bien sûr Linux Mint 17-18.

Un raccourci gImageReader est créé dans la section graphisme. Les deux derniers paramètres indiquent l'installation des langues françaises et anglaises.

Hors ligne

Pied de page des forums