punkt Was ist ein Formular?

Ein Formular ist ein Mittel zur Erfassung und Aufbereitung von Daten, das entweder als Papierformular oder in elektronischer Form (z. B. PDF-Formulare oder Web-Formulare) vorliegt.
Formulare dienen als Vorbereitung zur Sammlung von Information und können die Arbeit bei der Erfassung von Daten erheblich rationalisieren. Ein Formular ist also ein Informations- bzw. Datenträger.

Wir unterscheiden zwischen maschinenlesbaren, teilweise maschinenlesbaren und nicht maschinenlesbaren Formularen. Die folgenden Informationen beziehen sich auf maschinenlesbare Formulare. Selbstverständlich erfassen wir auch schlecht lesbare Formulare und Fragebögen, die nicht von uns designed wurden, zuverlässig und professionell (siehe Manuelle Datenerfassung).

 

punkt Maschinenlesbare Formulare

pfeil Welche Voraussetzungen muss ein maschinenlesbares Formular erfüllen?

- Gleichartigkeit der Formulare (Vorlage)

- Mindest-Auflösung 300 dpi

- Ordentliche Handschriften (deutliche Schrift ohne Unterbrechungen)

- Klare Felddefinition (z.B. kein Überschreiten der Feldbegrenzungen)

pfeil Welche Methoden für handschriftliche Eintragungen gibt es?

1) Text-Eintragungen
Wie oben erwähnt müssen bei maschinenlesbaren Formularen einzelne Felder bzw. Eintragungen streng voneinander abgegrenzt sein. Zu diesem Zweck werden die Texte oder meist auch die einzelnen Buchstaben durch vordefinierte Linien voneinander getrennt eingetragen. Oft werden Formulare nicht ordentlich ausgefüllt, z.B. kann es leicht passieren, dass über die vorgegebenen Linien geschrieben wird. In solchen Fällen ist es von Vorteil wenn diese Linien in einer nicht der Schriftfarbe entsprechenden Farbe gedruckt sind. Denn genau diese bei der automatisierten Auslesung störenden Linien können während des Scannens softwaretechnisch entfernt werden.

2) Markierungsfelder
In ein Markierungsfeld wird im Gegensatz zu Text-Feldern, wie der Name bereits sagt, lediglich eine Markierung gesetzt. Meist handelt es sich um ein Kreuz in X-Form innerhalb eines Kästchens, weshalb diese Felder auch „Ankreuzfelder“ genannt werden. Thematisch zusammen gehörende Markierungsfelder können auf Fragebögen zu Markierungsgruppen zusammengefasst werden.

pfeil Wie kann eine Vorlage eindeutig zugeordnet werden?

Die Zuordnung zu einer Vorlage erfolgt durch Referenz-Zeichen. In dieser Vorlage sind alle Felder eines Fragebogens definiert, die gelesen werden sollen. Auch die korrekte Ausrichtung der Fragebogen-Scans kann anhand der Rezerenz-Zeichen erkannt werden. Bilder mit falscher Ausrichtung werden automatisch in die richtige Richtung gedreht.

pfeil Was passiert, wenn verschiedene Formular-Vorlagen dieselben Referenz-Zeichen beinhalten?

Wenn eine Formular-Art absolut eindeutig gekennzeichnet werden muss, werden Barcodes / Strichcodes eingesetzt. Ein Barcode codiert Information in Form von schwarzen Linien bzw. Balken.

punkt Um aus maschinenlesbaren Formularen Daten zu extrahieren sind 5 Arbeitsschritte notwendig:

pfeil Scannen der Formulare (siehe auch Scannen)

pfeil Erstellen einer Vorlage pro Formular-Art (siehe auch Formular-Design)

pfeil Stapelverarbeitung: Zuordnung und Erkennung der Formular-Inhalte

pfeil Überprüfung der Erkennung und Qualitätskontrolle

pfeil Daten-Export ins gewünschte Format

 

punkt Erstellen einer Vorlage
Sollte ein Formular und die entsprechende Feldbeschreibung nicht bereits über eine Formular-Software erzeugt worden sein, muss dies direkt im Anschluss an den Scan-Prozess erfolgen. Texteintragungen, Markierungsfelder und Markierungsgruppen werden eingerichtet, Regeln für die einzelnen Felder werden programmiert.

 

punkt Scannen
Falls nötig müssen alle Formulare vor dem Scannen entkuvertiert, entklammert und sortiert (mehrseitige Formulare) werden. Anschließend werden alle Belege im Stapelbetrieb in 300 dpi eingescannt.

 

punkt Automatische Verarbeitung

Sind alle Vorlagen fertig eingerichtet werden die Formular-Images als Stapel in die Software importiert und alle Zeichen und Markierungen vollautomatisch erkannt. Dieser Vorgang kann je nach Komplexität und Informationsfülle der Vorlagen erheblich Zeit in Anspruch nehmen.

 

punkt Überprüfung und Qualitätskontrolle
Nicht oder nicht sicher erkannte Zeichen müssen überprüft werden. Zu diesem Zweck sind verschiedene Überprüfungs-Modi möglich, unter anderem können falsch erkannte gleichartige Zeichen (z.B. alle nicht sicher erkannten Ziffern „2“) im Batch- Modus angezeigt und überprüft werden.

 

punkt Datenexport
Alle erfassten und überprüften Daten werden in das benötigte Format exportiert und/oder in ein bestehendes System zur Verwaltung importiert.
Da unkompliziert und leicht weiterzuverarbeiten empfehlen wir folgende  Formate:

excel_icon Microsoft Excel access_icon Microsoft Access xml_icon XML text_icon TXT csv_icon CSV

 

Das Wort Statistik kann man umschreiben mit „Sammeln und Auswerten von Daten“. Wie auf der Seite Datenextraktion beschrieben beschäftigen wir uns intensiv mit der Kategorisierung, Erfassung, Vereinheitlichung und Konvertierung von Daten.

 

punkt Was kann DOCUBYTE im Bereich Statistik für Sie tun?
Wir arbeiten bisher nur mit Mitteln der deskriptiven Statistik. Das heißt die erfassten Daten aus Formularen, Fragebögen oder Online-Umfragen werden zusammengefasst und übersichtlich dargestellt. Meist werden zu diesem Zweck weitläufige Tabellen zu aussagekräftigen Grafiken verarbeitet.

In der Regel verwenden wir die folgenden Darstellungsformen
pfeil Kreisdiagramm

pfeil Balkendiagramm

pfeil Histogramm

pfeil Polygon

 

punkt Data Mining

Wenn es um Data Mining geht, verstehen wir uns als Basis-Dienstleister. Üblicherweise wird der Prozess des Data Mining in vier Schritte unterteilt:

pfeil Datenselektion
pfeil Datenvorbereitung
pfeil Mustererkennung
pfeil Kommunikation

 

Schritt 1 und 2 erledigen wir professionell.
Da wir aber kein Marktforschungs- bzw. Umfrageinstitut sind überlassen wir die Schritte 3 und 4, also die Bewertung von Daten und die Erstellung von Prognosen, den Profis!

Der Vorteil von PDF-Formularen ist, dass das Ausfüllen bereits am PC möglich ist und so die Lesbarkeit und somit auch die korrekte Extraktion der eingetragenen Informationen zu 100% gewährleistet werden kann. Außerdem können in PDF- Formularen Regeln hinterlegt werden um Falschangaben zu vermeiden (wie auch z.B. bei Web-Formularen). Falls die ausgefüllten Formulare nicht ausgedruckt werden müssen (z.B. aufgrund einer zwingend notwendigen Unterschrift), sondern digital an den Absender zurückgehen, kann sogar eine automatische Speicherung bzw. Auswertung der eingetragenen Daten vorgenommen werden.

 

adobereader_down

Zum Öffnen der unten aufgeführten PDF-Beispiele benötigen Sie Adobe Reader oder Adobe Acrobat ab Version 8.0.

Die aktuellste Version können Sie durch Klick auf den Adobe Reader Button links herunterladen.

 

 

PDF-Formulare - Beispiel 1

PDF-Formulare - Beispiel 1