Définition de l’OCR

adminagosto 19, 2020

63 2 minutos de lectura

OCR signifie Optical Character Recognition , une expression anglaise qui peut être traduite par . La notion est utilisée en informatique pour nommer une procédure qui permet de numériser un texte par le biais d’un scanner .

Ce que l’OCR rend possible est que, lorsqu’un texte passe par un certain appareil, le système reconnaît les caractères comme faisant partie d’un alphabet . De cette façon, le document scanné peut être édité avec un traitement de texte , puisqu’il n’est pas stocké comme une image.

De cette façon, l’OCR facilite le travail que beaucoup de personnes doivent faire . Si une personne scanne un livre dans l’intention d’en faire un résumé, grâce à l’OCR , elle pourra interagir avec le texte scanné par le biais d’un programme tel que Microsoft Word , en coupant, copiant et collant n’importe quel mot, ce qui est impossible sans un tel processus de reconnaissance, puisque l’ordinateur est incapable de comprendre le texte qui se trouve dans une image.

Outre l’avantage évident de stocker un texte en tant que tel et non en tant qu’image, il y a la différence de poids considérable : les images peuvent prendre beaucoup plus d’espace disque que les textes, et il faut en tenir compte si vous voulez faire scanner des livres entiers. Bien sûr, il n’est pas toujours conseillé à l’ordinateur d’effectuer une OCR, surtout s’il n’a pas l’intention d’éditer le contenu.

Il est curieux qu’une seule application puisse changer aussi radicalement la capacité d’un seul ordinateur, mais c’est le cas dans tous les cas : si les processeurs modernes peuvent être très efficaces, surtout lorsqu’ils sont associés à une mémoire et à des disques de pointe, ils ne sont d’aucune utilité sans les bons programmes, ce qui explique pourquoi la même machine peut passer d’inutilisable à extrêmement avancée simplement à cause du logiciel dont elle dispose.

Le cas de l’OCR est très particulier, car il donne à l’ordinateur une compétence de base pour la plupart des êtres humains : la lecture. Il convient de mentionner que ce n’est pas une tâche facile pour aucun de nous, bien que dans notre cas, nous apprenons généralement à le faire dès notre plus jeune âge, ce qui nous permet d’acquérir de grandes compétences, même lorsque nous devons faire face à une calligraphie difficile à comprendre.

Malgré les progrès de la technologie , l’OCR est toujours confronté à un certain nombre de problèmes. Il est par exemple assez difficile de faire reconnaître un texte manuscrit par un système numérique. Le processus se heurte souvent à des difficultés pour segmenter les différentes unités de texte. Il en va de même lorsque les mots apparaissent trop rapprochés.

D’autres défaillances de l’OCR peuvent apparaître lorsqu’il n’y a pas assez de contraste entre les mots et le fond. Supposons qu’un texte écrit en lettres noires soit imprimé sur une feuille de papier grise : le processus OCR peut ne pas être capable de distinguer les lettres et les mots .

N’oublions pas que, tout comme une action apparemment aussi simple que de marcher dans la rue nécessite une série d’actions complémentaires pour éviter les obstacles et protéger notre intégrité, la lecture d’un texte imprimé est le résultat de plusieurs tâches de reconnaissance simultanées, que nous effectuons presque inconsciemment, mais qui prennent notre temps.

Face à un texte, notre propre système d’OCR se charge de rechercher et de reconnaître le titre, d’identifier les paragraphes, les signes de ponctuation, les espaces entre les mots et les abréviations, entre autres éléments, ainsi que de faire un effort pour comprendre les polices trop ornementées ou peu soignées et pour compléter les informations dans les régions qui ont subi une usure quelconque, comme une tache d’encre ou un morceau de papier manquant.