dimanche 28 juillet 2013

Read Iris Pro… Quand ça ROC… !



Read Iris Pro - Quand ça ROC… !

La reconnaissance optique de caractères (ROC) désigne les procédés informatiques pour la traduction d’images de textes imprimés ou dactylographiés en fichiers de texte. Elle réalise beaucoup moins que l’être humain qui, lui, exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps. Un ordinateur réclame pour l’exécution de cette tâche un logiciel de reconnaissance optique de caractères, ROC ou OCR (abréviation du terme anglais optical character recognition), Celui-ci permet de récupérer le texte dans l’image d’un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou du moins, sur un support sûr et exploitable par un système informatique.

Une des premières entreprises a réalisé des logiciels grand-public fut Omnipage qui depuis a été racheté par Nuance Software (éditeur de Dragon Speech Recognition élément de base de SIRI sur iOS) Ce rachat a comme répercussion qu'Omnipage n'est plus disponible pour MAC OS.

Read Irisl effectue la reconnaissance optique des caractères dit OCR en jargon du métier. Ce procédé inventé dans les années 1950 est encore méconnu par plusieurs. Ce type de logiciel est multilingue car il doit aussi être capable de reconnaître les accents d'une langue à l'autre.
Readiris Pro 12 est une application simple, indispensable pour qui veut sauver temps et argent. Aussi, un simple numériseur à 75 $ fait très bien l'affaire par contre un numériseur plus coûteux permettra de « feeder » plusieurs feuilles (50) sans intervention humaine.

Il permet de numériser directement à partir du pilote de votre numériseur qui est reconnu par le logiciel ou encore d'importer un fichier image déjà enregistrer dans votre ordinateur.

Il fait bien la reconnaissance à condition d'avoir un document de bonne qualité sinon il est possible de créer un fichier de reconnaissance, c'est-à-dire de numériser une partie du document et nous soumet ce qu'il croit interpréter et c'est à nous d'indiquer les bonnes informations comme : nn peut paraître m si c'est une photocopie sur laquelle vous effectuez la reconnaissance… Pour le reste, c'est assez standard pour ce genre de logiciel soit la reconnaissance : texte en tableau | chiffrier Excel, en colonne, ournaux - etc.

L'application s'achète chez un fournisseur de produit informatique ou de façon moins coûteuse directement sur le site de Readiris qui est une entreprise des Pays-Bas




_______________________________________________________________________________

Brève histoire de la ROC

En 1950, Frank Rowlett, qui avait cassé le code diplomatique japonais PURPLE, demanda à David Shepard, un cryptanalyste de l’AFSA (prédécesseur de la NSA), de travailler avec Louis Tordella pour faire à l’agence des propositions de procédures d’automatisation des données. La question incluait le problème de la conversion de messages imprimés en langage machine pour le traitement informatique. Shepard décida qu’il devait être possible de construire une machine pour le faire, et, avec l’aide de Harvey Cook, un ami, construisit « Gismo » dans son grenier pendant ses soirées et ses week-ends. Le fait fut rapporté dans le Washington Daily News du 27 avril 1951 et dans le New York Times du 26 décembre 1953 après le dépôt du brevet numéro 2663758. Shepard fonda alors Intelligent Machines Research Corporation (IMR), qui livra les premiers systèmes de ROC au monde exploités par des sociétés privées. Le premier système privé fut installé au Reader’s Digest en 1955, et, de nombreuses années plus tard, fut offert par le Readers Digest au Smithsonian, où il fut mis en exposition. Les autres systèmes vendus par IMR à la fin des années 1950 comprenaient un lecteur de bordereau de facturation à l’Ohio Bell Company et un numériseur (scanner de documents) à l’US Air Force pour la lecture et la transmission par télex de messages dactylographiés. IBM et d’autres utilisèrent plus tard les brevets de Shepard.

Depuis 1965, la Poste des États-Unis utilise pour trier le courrier des machines ROC dont le principe de fonctionnement a été imaginé par Jacob Rabinow, un inventeur prolifique. La Poste canadienne utilise des systèmes ROC depuis 1971. Les systèmes ROC lisent le nom et l’adresse du destinataire au premier centre de tri automatisé, et impriment sur l’enveloppe un code-barres fondé sur le code postal. Les lettres n’ont plus qu’à être triées dans les centres suivants par des trieuses moins coûteuses qui n’ont qu’à lire le code-barres. Pour éviter toute interférence avec l’adresse lisible qui peut se trouver n’importe où sur la lettre, une encre spéciale est utilisée, qui est clairement visible sous une lumière UV. Cette encre semble orange dans des conditions d’éclairage normales. (source Wikipedia et recherches personnelles)


Aucun commentaire:

Publier un commentaire