Reconnaissance OCR

N'hésitez pas à poster si vous avez une idée d'amélioration du programme
Post Reply
Antowoine
Posts: 15
Joined: 04 Aug 2014, 09:44

Reconnaissance OCR

Post by Antowoine »

Salut à tous,

J'ai pensé à une nouvelle fonctionnalitée sympas, je m'explique :
Une fonction de reconnaissance de texte (OCR) qui permettrai de reconnaître un texte et de le stocker dans une variable définie préalablement.

Voilà je sais pas si ça vous intéresse mais je pense que ça serait cool
User avatar
Jmgr
Admin
Posts: 1649
Joined: 07 Dec 2005, 15:45
Contact:

Re: Reconnaissance OCR

Post by Jmgr »

Salut,

Si c'est pour passer des captcha ça ne fonctionnera pas :) Sinon, c'est assez difficile de trouver des outils qui permettent d'obtenir une bonne reconnaissance de caractères sans passer par une requête vers un serveur distant (par exemple avec un service distant), et qui soit en plus gratuit et libre.

J'avais tenté de trouver une bibliothèque d'OCR il y a quelques années, ainsi qu'un système de synthèse vocale, mais n'ai rien trouvé de concluant.
"My software never has bugs. It just develops random features."
Violette
Posts: 119
Joined: 10 Aug 2014, 17:42

Re: Reconnaissance OCR

Post by Violette »

Yop,

pour l'OCR en JS il y a http://antimatter15.com/ocrad.js/demo.html et https://github.com/antimatter15/gocr.js (les 2 sont quasi identiques, le dernier surement plus facilement adaptable à Actiona) qui marche très bien sur navigateur, j'avais déjà tenté de le faire fonctionner avec Actiona mais syntax error au moindre .delete() .continue() du coup j'ai fini par laisser tomber (d'ailleurs pourquoi un syntax error ?) mais il y a peut être moyen malgré tout.

Faudrait que je trouve la motiv pour regarder ce qu'il demande exactement en entrée etc mais pffff vlà le bazard. Perso j'ai fini par opter pour une méthode plus "artisanal" a base de découpages de caractères et de recherche d'image. C'est pas très très rapide mais ça passe. Par contre faut faire attention aux différentes polices.

Ils sont basés sur Tesseract https://code.google.com/p/tesseract-ocr/wiki/APIExample, un OCR open-source :p.
User avatar
Jmgr
Admin
Posts: 1649
Joined: 07 Dec 2005, 15:45
Contact:

Re: Reconnaissance OCR

Post by Jmgr »

delete() et continue() ne sont pas des fonctions d'Ecmascript. Le problème c'est que ces outils sont conçus pour être utilisés 1) dans un navigateur 2) dans NodeJS 3) dans un interpréteur JavaScript. Manque de pot, Actiona utilise un interpréteur EcmaScript, et non JavaScript. JavaScript est basé sur EcmaScript, mais ajoute des fonctionnalités qui du coup ne sont pas présentes dans Actiona. Un portage est peut-être possible, mais ça serait très long et mes connaissances en JS sont trop limitées.

Je crois qu'ils sont basés sur OCRAD plutôt que Tesseract. En tous cas je n'ai jamais essayé OCRAD, ça peut valoir le coup de l'intégrer directement à Actiona.
"My software never has bugs. It just develops random features."
Violette
Posts: 119
Joined: 10 Aug 2014, 17:42

Re: Reconnaissance OCR

Post by Violette »

delete() et continue() ne sont pas des fonctions d'Ecmascript.
Ah ben forcément, tout s'explique XD.
Je crois qu'ils sont basés sur OCRAD plutôt que Tesseract. En tous cas je n'ai jamais essayé OCRAD, ça peut valoir le coup de l'intégrer directement à Actiona.
My bad je ne sais plus lire... :roll:.
Antowoine
Posts: 15
Joined: 04 Aug 2014, 09:44

Re: Reconnaissance OCR

Post by Antowoine »

Jmgr wrote:Si c'est pour passer des captcha ça ne fonctionnera pas :)
Non non :D Je sais pas pour des jeux, sites ou images par exemple
Post Reply