Automatisierte Datenerfassung durch professionelle Texterkennungssoftware

Was bedeutet OCR?

Die Abkürzung OCR steht für Optical Charakter Recognition. Entsprechende deutsche Begriffe lauten optische Zeichenerkennung oder Texterkennung. OCR dient hauptsächlich dem schnellen, automatisierten Auslesen von gedrucktem Text aus gescannten Dokumenten. Die reine Texterkennung sollte nicht mit ICR-Verfahren (dem softwarebasierten Auslesen von Handschriften) oder OMR-Technik (elektronische Erfassung von Fragebögen und Fomularen) verwechselt werden.

OCR: Optical Charakter Recognition (Erkennung von gedrucktem Text)

OMR: Optical Mark Recognition (Erkennung von Formularfeldern)

ICR: Intelligent Character Recognition (Erkennung von Handschriften)

Texterkennung ohne Korrektur

Mit OCR Software kann sehr viel Text innerhalb relativ kurzer Zeit erfasst werden. Bei guten Original-Dokumenten mit normaler Schriftgröße und einfachem Layout (wenige Bilder, keine Tabellen, kein Spalten-Text, keine Fußnoten oder Kolumnentitel) erreichen wir Erkennungsraten von 95% und mehr. Wir können auf jahrelange Erfahrung im Bereich OCR zurückblicken und konnten die Entwicklung und Perfektionierung dieser Technologie mitverfolgen. Wir analysieren Ihre Dokumente vorab, produzieren optimale Scans für die Auslesung (Entfernung von Hintergrund und Flecken, Textverbesserung, Kontrast- und Helligkeitsanpassung, Erkennung der Seitenausrichtung, Entfernen von schwarzen Rändern) und programmieren unsere OCR Software auf Ihre Bedürfnisse angepasst, sodass auch Sonderzeichen und Symbole korrekt erkannt und ausgegeben werden. Wir verfügen über die notwendigen Ressourcen, um auch große Mengen von Dokumentenscans in kurzer Zeit verarbeiten zu können. Grundsätzlich ist heutzutage ein softwaretechnische Auslesung auch bei Handschriften möglich. Insbesondere bei händisch ausgefüllten Formularen und Fragebögen in hoher Auflage kann eine softwaregestützte Datenerfassung  – z.B. von per Hand eingetragenen Ziffern – unserer Erfahrung nach durchaus Sinn machen.

OCR Texterkennung

Funktionsweise der Bildanalyse bei moderner Texterkennungssoftware.

↑Zum Vergößern bitte klicken↑

Datenerfassung-OCR-Korrekturservice

Es ist möglich die Ergebnisse der automatisierten Texterkennung manuell zu überprüfen und ggf. zu berichtigen.

Texterkennung mit Korrekturservice

Falls eine Genauigkeit von bis zu 95% nicht ausreichend ist oder schwierige Belege verarbeitet werden müssen, bieten wir einen OCR-Korrektur-Service an. Dabei werden alle von der Texterkennungs-Software als nicht korrekt erkannt eingestuften Buchstaben und Wörter einer manuellen Prüfung durch einen unserer Mitarbeiter unterzogen. Anschließend erfolgt auf Wunsch eine Rechtschreibkorrektur des gesamten Textes.

Auch alte Schriften wie beispielsweise Fraktur und Sütterlin können mit Hilfe einer speziellen OCR-Software erfasst werden. Allerdings sind in diesem Fall manuelle nachkorrekturen in aller Regel unerlässlich. Allein die schlechte Qualität der oftmals verbleichten Schriften oder die zum Teil starken Verschmutzungen des gealterten Papiers erschweren einen vollautomatisierten Prozess und liefern im Allgemeinen unbefriedigende Ergebnisse.