Intelligente Texterkennung (OCR)

Was bedeutet OCR? 
OCR ist die Abkürzung für die englische Bezeichnung „optical character recognition“ und wird im Deutschen als optische Zeichenerkennung oder auch als Texterkennung übersetzt. Der Begriff OCR stammt aus der Informationstechnik und wird für die automatisierte Texterkennung in digitalen Bildern verwendet. 

Wenn Dokumente – wie beispielsweise Rechnungen – über bestimmte Eingabegeräte (z.B. Handyfoto, Scanner) digital bereitgestellt werden, liegen diese nur als Rastergrafik vor. OCR analysiert diese Rastergrafiken und kann Buchstaben, Zeichen sowie Zahlen automatisch erkennen und Textblöcke von Grafiken in dem Dokument unterscheiden. Der erkannte Text wird überprüft und korrigiert, um Fehler zu minimieren. Dies kann durch Wörterbücher oder Kontextanalyse geschehen Dadurch können die Textanteile in den Dokumenten auch als solche zur Be- und Verarbeitung bereitgestellt werden, was z.B. die automatisierte Zuordnung von eingescannten Rechnungen im Rechnungseingangsmanagement ermöglicht. Auch die Volltextrecherche in Dokumentenmanagement-Systemen wird mit Hilfe von OCR ermöglicht. OCR-Software ist zudem ein wesentlicher Bestandteil im Input Management und kann in diesem Kontext beispielsweise den Eingang von PDF-Rechnungen erleichtern. 

 

Abbildung OCR-Ablauf
Abb: Ablauf eines OCR-Prozesses

 

Vorteile von OCR 
Für Unternehmen und deren Geschäftsdokumente bringt die intelligente Texterkennung viele Vorteile mit sich: 

  • Geringerer Aufwand durch automatisierte Erkennung von Texten in sämtlichen digitalen Dokumenten (PDF-Dateien, Scans, Bilder, Fax, etc.) 
  • OCR ermöglicht die automatisierte Zuordnung von gescannten Dokumenten, Bildern, etc. 
  • OCR ermöglicht das Durchsuchen von PDF-Dokumenten, Bildern, etc. 
  • Zeitersparnis, da beispielsweise kein mühsames Abtippen erforderlich ist 
  • Kostenersparnis, da der manuelle Aufwand im Umgang mit digitalisierten Dokumenten stark reduziert wird 
  • Direkte Bearbeitung von digitalen Dokumenten durch das automatisierte Einlesen von gedruckten/geschriebenen Texten 
     

Gerne unterstützen wir Sie in diesem Bereich mit unserer umfassenden Expertise. Die ISR-eigene Lösung oder IBM Datacap helfen Ihnen, Dokumentenberge schnell und günstig zu erfassen, zu erkennen und automatisch einzuordnen – ohne, dass manuelles Eingreifen erforderlich wird. Lassen Sie sich von unserem Business Process Automation Team beraten!