3,4 min readPublished On: 31. August 2021By Tags: , , Categories: Bücher, Wissen

Tippst Du noch, oder scannst Du schon? Was ist OCR? 

Ich hab das immer abgetippt.

Was machst Du, wenn Du ein oder mehrere bedruckte Blätter Papier bekommst, deren Text Du weiterbearbeiten möchtest? Lange Zeit habe ich mich in dieser Situation dann hingesetzt, den Text mühsam abgetippt und dabei geflucht wie ein Rohrspatz. Irgendwann entdeckte ich dann eine neue Funktion auf meinem Smartphone, die einen fotografierten Text in einen digitalen Text umwandeln kann. Alles, was ich dafür machen muss, ist, den Text zu fotografieren, das Bild des Textes zu öffnen und dann einen einzigen Knopf zu drücken. Das Programm scannt nun das Bild und macht aus dem analogen einen digitalen Text, den ich schnell und einfach kopieren kann.

Lange Zeit hielt ich diese Funktion für magisch. Doch dann erklärte mir meine Twitter-Bubble, dass diese magische Texterkennung in Dokumenten OCR heißt und nicht nur auf meinem Smartphone, sondern auch in vielen Druckern mit Scanner- Funktion funktioniert. Dank

O. Tuhls: Microsoft Word im Homeoffice und mobil

habe ich gelernt, dass OCR für Optical Character Recognition steht und auch in der OneDrive-App funktioniert. Dank all dieser Hinweise freue ich mich nun darauf, gemeinsam mit Dir herauszufinden,

  • wer die Optical Character Recognition (OCR) erfunden hat,
  • wie OCR funktioniert,
  • welche Programme über OCR verfügen.

Los geht’s:

Wer hats erfunden?

Auf den ersten Blick scheint es Niemanden zu geben, der OCR erfunden hat. OCR ist das Ergebnis einer ständigen technischen Weiterentwicklung, die lange vor der Erfindung des Computers begann. Die ersten Schritte der Texterkennung wurden gemacht, um

  • die 1837 erfundene Telegrafie zu vereinfachen,
  • blinden Menschen zu helfen.

1914 erfand Emanuel Goldberg eine Maschine, die in der Lage war, Texte zu lesen und diese in telegrafische Nachrichten zu verwandeln.

Bitte fülle das Formular aus.

Ein weiterer wichtiger Schritt für die OCR waren Formulare, die im Verlauf des 20. Jahrhunderts die Welt der Behörden und Banken eroberten. Um die Bearbeitung von Formularen zu beschleunigen wurden sogar eigene Schriftarten namens OCR-A, OCR-B und AOCR-H entwickelt. Bei diesen Schriftarten wurde auf die klare Unterscheidbarkeit der Buchstaben geachtet, damit die Schrift von Maschinen gut erkannt werden konnte.

Wie funktioniert OCR?

Im Grunde genommen macht die Optical Character Recognition genau das, was sie sagt: Sie erkennt Buchstaben. Das klingt im ersten Moment sehr einfach. Doch die Sache ist die:

  • Es gibt sehr viele Schriftarten.
  • Gedruckte Dokumente haben nicht immer eine hohe Papier- und / oder Druckqualität.
  • Manche Zeichen, wie zum Beispiel B und 8 oder I und 1 unterscheiden sich kaum voneinander.

Diese und andere Faktoren führen dazu, dass ein mit Hilfe von OCR gescannter Text nicht immer 1 zu 1 mit dem Original übereinstimmt. Um diese „Schwäche“ des OCRs zu beseitigen, wird OCR immer häufiger mit anderen Technologien kombiniert. So wandelt zum Beispiel eine Intelligent Character Recognition (ICR) beim Wort 8aum die erkannte 8 in ein B um, weil es wahrscheinlicher ist, dass es Baum heißen muss.

Programme mit OCR

Dank des technischen Fortschrittes ist OCR inzwischen in vielen Programmen vertreten. Hier ist eine Liste von Programmen, bei denen Du OCR testen kannst.

Fazit

Ich liebe OCR und verwende es, wo immer ich kann. Seitdem ich weiß, was OCR leistet, begegnen mir immer wieder neue Technologien, die mir helfen, analoge Daten zu verarbeiten. So kann zum Beispiel die Kamera App meines Smartphones nicht nur Texte, sondern auch Bilder auslesen. Das ist unglaublich praktisch, wenn ich herausfinden möchte, wer der Künstler eines Bildes ist, das ohne Urheberangaben in Social Media geteilt wurde. Auch die Diktierfunktion in Word möchte ich nicht mehr missen. Statt Lexikoneinträge für Blogbeiträge abzutippen, diktiere ich diese und korrigiere danach nur noch die Dinge, die Word nicht verstanden hat.

An dieser Stelle bin ich wie immer neugierig: Wofür nutzt Du OCR? Kennst Du Programme (und einfache Anleitungen), die in unserer Liste fehlen?