|
Ein Formular ist ein Mittel zur Erfassung und Aufbereitung von Daten, das entweder als Papierformular oder in elektronischer Form (z. B. PDF-Formulare oder Web-Formulare) vorliegt. Wir unterscheiden zwischen maschinenlesbaren, teilweise maschinenlesbaren und nicht maschinenlesbaren Formularen. Die folgenden Informationen beziehen sich auf maschinenlesbare Formulare. Selbstverständlich erfassen wir auch schlecht lesbare Formulare und Fragebögen, die nicht von uns designed wurden, zuverlässig und professionell (siehe Manuelle Datenerfassung).
- Gleichartigkeit der Formulare (Vorlage) - Mindest-Auflösung 300 dpi - Ordentliche Handschriften (deutliche Schrift ohne Unterbrechungen) - Klare Felddefinition (z.B. kein Überschreiten der Feldbegrenzungen)
1) Text-Eintragungen 2) Markierungsfelder
Die Zuordnung zu einer Vorlage erfolgt durch Referenz-Zeichen. In dieser Vorlage sind alle Felder eines Fragebogens definiert, die gelesen werden sollen. Auch die korrekte Ausrichtung der Fragebogen-Scans kann anhand der Rezerenz-Zeichen erkannt werden. Bilder mit falscher Ausrichtung werden automatisch in die richtige Richtung gedreht.
Wenn eine Formular-Art absolut eindeutig gekennzeichnet werden muss, werden Barcodes / Strichcodes eingesetzt. Ein Barcode codiert Information in Form von schwarzen Linien bzw. Balken.
Sind alle Vorlagen fertig eingerichtet werden die Formular-Images als Stapel in die Software importiert und alle Zeichen und Markierungen vollautomatisch erkannt. Dieser Vorgang kann je nach Komplexität und Informationsfülle der Vorlagen erheblich Zeit in Anspruch nehmen.
Das Wort Statistik kann man umschreiben mit „Sammeln und Auswerten von Daten“. Wie auf der Seite Datenextraktion beschrieben beschäftigen wir uns intensiv mit der Kategorisierung, Erfassung, Vereinheitlichung und Konvertierung von Daten.
In der Regel verwenden wir die folgenden Darstellungsformen
Wenn es um Data Mining geht, verstehen wir uns als Basis-Dienstleister. Üblicherweise wird der Prozess des Data Mining in vier Schritte unterteilt:
Schritt 1 und 2 erledigen wir professionell. Der Vorteil von PDF-Formularen ist, dass das Ausfüllen bereits am PC möglich ist und so die Lesbarkeit und somit auch die korrekte Extraktion der eingetragenen Informationen zu 100% gewährleistet werden kann. Außerdem können in PDF- Formularen Regeln hinterlegt werden um Falschangaben zu vermeiden (wie auch z.B. bei Web-Formularen). Falls die ausgefüllten Formulare nicht ausgedruckt werden müssen (z.B. aufgrund einer zwingend notwendigen Unterschrift), sondern digital an den Absender zurückgehen, kann sogar eine automatische Speicherung bzw. Auswertung der eingetragenen Daten vorgenommen werden.
PDF-Formulare - Beispiel 1
|
