Seit dem Jahr 2002 erfassen wir professionell Daten in großen Mengen. Die manuelle Datenerfassung ist trotz der in den letzten Jahren merklich verbesserten OCR Systeme nach wie vor ein entscheidend wichtiger Prozess. Denn eine gute Datenqualität ist ohne menschliche Kontrolle in den meisten Fällen nicht möglich.

 

dot WARUM SIND MANUELLE ERFASSUNGSVERFAHREN UND OCR-KONTROLLEN NOTWENDIG?

Die Erkennungsgenauigkeit moderner OCR Systeme reicht von 80% bei schlechten Vorlagen bis zu 95% bei sehr guten Vorlagen (z.B. EDV-Ausdrucke mit Schriftgröße 10 Punkt). Folglich bleibt selbst bei guten Vorlagen für jedes einzelne Zeichen ein Restrisiko von mindestens fünf Prozent, nicht korrekt erkannt und erfasst zu werden. Bei normalen handschriftlichen Dokumenten (Schreibschriften) ist eine automatisierte Erfassung in der Regel nicht sinnvoll, da die Programmierung sehr aufwendig und teuer ist und erfahrungsgemäß nur bei gleichartigen Handschriften und entsprechend hinterlegten Referenzdaten gute Ergebnisse möglich sind. Jeder Ausnahmefall kann zu einer Falscherfassung und damit zu falschen Daten führen.

 

dot WELCHE DATEN KÖNNEN ERFASST WERDEN? 

» Volltext (Fraktur/Handschriften/Druckvorlagen/Tabellen…)

» Response (Adressen, Bestellungen, Aufträge)

» Indices (Auftragsnummern, Bestellnummern, etc.)

» Fragebögen/Formulare

 

dot WELCHE ZUSATZLEISTUNGEN BIETET DOCUBYTE AN? 

» XML-Konvertierung

» HTML-Konvertierung

» Adressen-Bereinigung/-Anreicherung

» Spezialaufgaben werden auf Anfrage bearbeitet

 

dot WIE FUNKTIONIERT DIE MANUELLE DATENERFASSUNG?

An erster Stelle unserer Prozesse steht das Scannen aller Dokumente. Wenn möglich werden Daten immer vom digitalen Beleg erfasst. Gründe hierfür sind

» Die Kosten können durch vollständige oder teilweise OCR-Bearbeitung reduziert werden

» Eine Verknüpfung der erfassten Daten zum entsprechenden digitalen Bild wird hergestellt, dadurch ist auch im Nachhinein eine Kontrolle möglich

» Die Archivierung der digitalen Belege in Form von Images wird dadurch ermöglicht (die Originale können oft vernichtet werden)

» Schwierige Belege werden im Voraus gesichtet und sortiert

» Es kann eine frühzeitige Analyse der Dokumente erfolgen und  damit eine präziser und schneller Erfassungs-Prozess gewährleistet werden


Grundsätzlich muss man gerade  auch bei der manuellen Datenerfassung davon ausgehen, dass Fehler gemacht werden. Handschriften, insbesondere Schreibschriften, werden bei DOCUBYTE von Hand erfasst. Und wo Menschen arbeiten werden erfahrungsgemäß auch Fehler gemacht! Wir haben bereits vor Jahren ein System entwickelt, das auch anspruchsvollen Projekten mit sehr hohen Genauigkeitsanforderungen gerecht wird – unser Doppelerfassungs-System. Bei der Doppel-Erfassung  werden alle Texte zweimal abgeschrieben, elektronisch miteinander verglichen und auf Ungleichheiten geprüft. Jeder Datensatz, bei dem sich auch nur ein Buchstabe der beiden Erfassungs- Varianten unterscheidet, wird von einem dritten Typisten verifiziert. Anschließend durchwandert eine definierte Stichprobe eine ausführliche Qualitätskontrolle.
Durch dieses Verfahren erreichen wir eine garantierte Genauigkeit von bis zu 99,98%. Je nach Anforderung kann durch Dreifach-Erfassung eine Genauigkeit von bis 99,999 % gewährleistet werden.
Auch bei handschriftlichen Vorlagen, altdeutscher Schrift, Sütterlin und Dokumenten bis zum 16. Jahrhundert ist es unserer Erfahrung nach unumgänglich auf manuelle Erfassungsmethoden zurückzugreifen.

METHODE GARANTIERTE GENAUIGKEIT
OCR bis zu 98 % bei guten Vorlagen
Einfach-Erfassung 99,900 %
Einfach-Erfassung + Verifizierung 99,950 %
Doppel-Erfassung + Doppel-Verifizierung 99,980 %
Dreifach-Erfassung + Dreifach-Verifizierung 99,999 %

dot WAS IST TEXTERKENNUNG (OCR)

Die drei Buchstaben OCR stehen für Optical Charakter Recognition, entsprechende deutsche Begriffe lauten Optische Zeichenerkennung oder Texterkennung. OCR dient hauptsächlich dem schnellen, automatischen Auslesen von gedrucktem Text aus digitalen Bildern.

 

dot WELCHE VORTEILE HAT OCR
Mit OCR Software kann sehr viel Text innerhalb relativ kurzer Zeit erfasst werden. Bei guten Original-Dokumenten mit normaler Schriftgröße und einfachem Layout (wenige Bilder, keine Tabellen, kein Spalten-Text, keine Fußnoten oder Kolumnentitel) erreichen wir Erkennungsraten von 95% und mehr.

 

dot WARUM PROFITIEREN SIE VOM DOCUBYTE OCR-SERVICE 

Wir können auf sieben Jahren Erfahrung im Bereich OCR zurückblicken und konnten die Entwicklung und Perfektionierung dieser Technologie mitverfolgen. Wir Analysieren Ihre Dokumente vorab, produzieren optimale Scans für die Auslesung (Entfernung von Hintergrund und Flecken, Textverbesserung, Kontrast- und Helligkeitsanpassung, Erkennung der Seitenausrichtung, Entfernen von schwarzen Rändern) und programmieren unsere OCR Software auf Ihre Bedürfnisse angepasst, sodass auch Sonderzeichen und Symbole korrekt erkannt werden. Wir verfügen über die notwendigen Ressourcen, um auch große Mengen von Dokumenten in kurzer Zeit verarbeiten zu können. Falls eine Genauigkeit von bis zu 95% nicht ausreichend sein sollte oder schwierige Belege verarbeitet werden müssen bieten wir einen, insbesondere auch für Verlagshäuser interessanten, OCR- Korrektur-Service an.

 

dot PRAKTISCH UND FÜR JEDERMANN ZUGÄNGLICH: DURCHSUCHBARE PDF-DATEIEN
Um eine solche Datei aus Papierdokumenten zu erstellen sind folgende Schritte notwendig:

 
pfeil Step 1:

Vorbereitung der Papier-Dokumente für das Scannen

 

 
pfeil Step 2:

Scannen der Dokumente im Batch-Verfahren an Hochleistungs-Scannern

 

 
pfeil Step 3:

Vollautomatisierte Auslesung der Text-Inhalte durch OCR-Software

 

 
pfeil Step 4:

Ausgabe als Single- oder Multi-Page-PDF oder PDF/A Dokument

 

 

VORTEILE VON PDF
Plattformunabhängig darstellbares Format
Eine Volltextsuche ist möglich
Die Verarbeitung ist sehr kostengünstig
Die Erfassung geht sehr schnell

NACHTEILE VON PDF

Text kann falsch erkannt und aufgrund dessen nicht mehr gefunden werden (aufwändige Verifizierung durch manuelle Nachkorrektur ist möglich)

VORAUSSETZUNGEN FÜR GUTE OCR
Scannen in 300 dpi Auflösung
Gute Lesbarkeit der Texte
Keine kleinen Schriftarten (kleiner 8 Pt)
Kein komplexes Layout

dot SCANNEN

Auch bei der Adresserfassung gilt: wenn möglich werden alle Belege zuvor eingescannt. Zu diesem Zweck werden alle Response-Elemente scangerecht aufbereitet und kategorisiert. So ist später jederzeit eine Zuordnung eines erfassten Datensatzes zum Original-Beleg in Form eines Images möglich. Das ist vor allem auch dann interessant, wenn Unterschriften vorhanden sein müssen.

 

dot ERFASSUNG MIT REFERENZDATEN 

Wir sind auf die manuelle Erfassung von Adressen spezialisiert und haben bereits viele Millionen Response- Elemente zur vollen Zufriedenheit unserer Kunden erfasst. Der Erfolg unserer Erfassungs-Systeme beruht unter anderem auf Referenzdaten. Ohne hinterlegte Referenzwerte wie beispielsweise Anrede, Vorname, Nachname, Postleitzahl, Ort und Straße können Adress-Daten in der Regel nicht einheitlich und korrekt erfasst werden. Das liegt oft nicht an den Typisten, sondern an den Personen, die die Belege ausfüllen. Denn viele Menschen schreiben sehr undeutlich, tragen falsche bzw. postalisch nicht richtige Orte und Straßen ein oder geben schlicht und einfach durchwegs falsche Daten an. Die Erfassung von Response-Elementen mithilfe von aktuellen und umfassenden Referenzdaten berichtigt nicht nur fehlerhafte Angaben, sondern hilft gleichzeitig die Erfassungszeit enorm zu reduzieren!

» Die Ortsangabe erscheint automatisch nach der Eingabe der Postleitzahl

» Der Straßenname wird nicht erfasst, sondern aus einer Liste möglicher Straßennamen ausgewählt

» Vor- und Nachnamen können ebenfalls aus Listen ausgewählt werden

» Die Anrede wird bei bekanntem Vornamen und Eindeutigkeit automatisch eingefügt

 

dot ZOOMING METHODE
Um weiter Zeit bei der Erfassung einzusparen arbeiten wir bei gleichartigen Belegen mit einer Zooming- Methode. Das bedeutet, dass am Bildschirm des Typisten immer nur das gerade zu erfassende Feld angezeigt wird. Da die Programmierung der Zooming-Funktion, insbesondere die Definition der Feldpositionen, einen gewissen Aufwand verursacht, ist die Voraussetzung eine bestimmte Mindestmenge an zu erfassenden, gleichartigen Belegen.

 

dot FÜR FOLGENDE LÄNDER IST EINE ERFASSUNG MIT REFERENZDATEN MÖGLICH 
 

de Deutschland at Österreich ch Schweiz es Spanien gb Groß Britannien fr Frankreich

DOCUBYTE hat sich im Bereich Pharma auf die professionelle Erfassung und Verarbeitung von Lagerwertausgleichen und Bestellungen spezialisiert. Unser Know-How beschränkt sich nicht nur auf die reine Datenerfassung, sondern wir sind imstande individuelle Workflow-Systeme und Erfassungsapplikationen in Ihren bisherigen Ablauf einzubinden.

 

dot WO LIEGEN DIE PROBLEME BEI DER ERFASSUNG VON LAGERWERTAUSGLEICHEN?

» Die Belege sind unterschiedlich aufgebaut, was eine automatische Auslesung durch OCR erschwert und fehleranfällig macht

» Die Qualität der Belege ist teilweise sehr schlecht, da Faxe eine niedrige Auflösung haben und Faxgeräte oft störende Streifen verursachen

» Die Ausgleichs-Summe wird i.d.R. als Gesamtsumme pro Kunde erfasst. Dadurch können Berechnungsfehler der Kunden nicht identifiziert werden

» Doppelt eingeschickte Lagerwertausgleiche können nicht ohne Weiteres identifiziert werden. Wird ein Fax zweimal geschickt, erfolgt eine Gutschrift zu viel

» Es existiert keine oder keine exakte Statistik über die Lagerwertausgleiche pro verkauften Artikel

» Bei Reklamationen oder Nachfrage seitens der Apotheken entsteht ein relativ hoher Bearbeitungsaufwand

 

dot WELCHEN LÖSUNGSWEG GEHT DOCUBYTE?

» Faxempfang durch DOCUBYTE Fax-Server oder den unternehmenseigenen Fax-Server

» Scannen von schriftlichen Einreichungen

» Tägliche Weiterleitung der Faxe zu DOCUBYTE

» Erfassung der einzelnen Positionen pro Einreichung

» Fehlerfreie Erfassung durch eine datenbankgestützte Erfassungsapplikation mit aktuellen Referenzdaten

» Erfassung und Rücklieferung der Daten innerhalb einer Woche

» Automatisierte Identifikation von doppelt eingegangenen Gutschriftenforderungen

» Systematische Kennzeichnung von unlesbaren Belegen und falschen Summen

» Bereitstellung der Daten und Images in einem Online-Recherche-System oder Import in ein vorhandenes System

» Schneller und unkomplizierter Zugriff auf alle Daten und Faxe aller eingereichten Lagerwertausgleiche

 

dot WIE PROFITIEREN PHARMA-UNTERNEHMEN VON DOCUBYTE?

Kostenreduzierung durch

- Deutlich entlastete Mitarbeiter

- Vorzeitiges Erkennen von Dubletten

- Vermeidung von Druckkosten

Zufriedene Kunden durch

- Schnelle Gutschriften

- Auskunftsfähigkeit bei Reklamation

- Positives Image bei den Apotheken

Präzise Statistik

- Exakter Deckungsbeitrag pro Artikel

- Genaue Statistik über Einreichung --pro Apotkeke

 

dot ERFASSUNG

Schwerpunkt bei der Erfassung von Audiodateien bildet bei uns bisher die Adresserfassung bei Gewinnspielen. Auch bei der Erfassung von Audio-Dateien werden unsere Typisten durch ein Software-System und Referenzdaten unterstützt, um einheitliche Daten und eine gute Qualität zu gewährleisten. Werden wichtige Adress-Informationen nicht genannt, ist eine Anreicherung durch unsere Adressdatenbanken möglich.

Selbstverständlich wird auch die Erfassung von Interviews, Vorträgen, Gruppendiskussionen, Tagungen, Kongressen, Meinungsumfragen, etc. professionell erledigt.

 

dot FORMATE 

Unser Erfassungssystem erlaubt die Audio-Formate

mp3_icon MP3 wav_icon WAV wma_icon WMA

 

Die im folgenden aufgeführten Medien werden vor der Erfassung in eines der oben angegebenen Formate konvertiert:

» Normal-Kassetten

» Mini-Kassetten

» Micro-Kassetten

» Grundig-Kassetten

» MiniDisc

 

dot LIEFERUNG

Üblicherweise werden die erfassten Daten als Microsoft Excel oder Word-Datei ausgegeben, aber auch viele andere Output-Formate sind möglich. Unsere Kunden erhalten Ihre Daten entweder durch die Post (CD/DVD), durch Abholung von unserem Server oder als E-Mail-Anhang.

 

dot TONQUALITÄT 

Eine gute Tonqualität ist Voraussetzung für ordentliche Arbeit. Werden besonders detaillierte Transkriptionen von Interviews oder Vorträgen gewünscht (zum Beispiel mit sekundengenauer Erfassung von Sprechpausen oder Wiedergabe sämtlicher nonverbaler Aktivitäten) sind wir aufgrund des zusätzlichen Aufwands gezwungen einen Aufpreis zu erheben. In solchen Fällen verlangen wir in der Regel vor Angebotserstellung eine Beispiel-Datei, um die Tonqualität und den daraus resultierenden Aufwand einschätzen zu können.