DIEW DMS Software - Dokumentenmanagement - Dokumentenverwaltung - Archivierung

Erfassen von Dokumenten

Das Erfassen durch Scannen

Die Hierarchie, in der die Dokumente abgelegt werden, wird vor dem Erfassen der Dokumente mit dem Scanner angelegt. Meist besteht eine Ordnung, die man für die Ablage der Dokumente verwenden kann. Dies sind z. B. Schränke, Ordner und deren Register, die in einer entsprechenden Struktur im Projektbaum angelegt werden können. Es gibt verschiedene Betriebsmodi zum Erfassen der Dokumente. Es macht nämlich einen Unterschied, ob Sie Dokumente im täglichen Betrieb oder ob Sie größere Mengen Altbestände erfassen. Normalerweise werden in Aktenordnern die Dokumente so abgelegt, dass die neuen Dokumente oben eingeheftet werden. Werden diese Aktenordner gescannt, dann sind die neuen Dokumente oben und sollen es in der Hierarchie im Projektbaum auch bleiben. Deshalb muss beim Scannen eine neue Datei unten eingefügt werden. Erfasst man Dokumente im täglichen Betrieb, dann müssen die neu eingescannten Dokumente oben abgelegt werden. Deshalb ist die Arbeitsweise im Programm einstellbar. Zusätzlich können Sie beim Erfassen auch eine sinnvolle Bezeichnung eingeben, die das Dokument näher spezifiziert. Bei größeren Dokumentenmengen ist dies allerdings nicht praktikabel. Bei Erfassen größerer Altbestände werden daher die Bilder der Dokumente einfach der Reihe nach nummeriert. Ein späteres Wiederfinden von Dokumenten ist über eine Suche mittels der Texterkennung möglich. Daher ist eine vollständige Indizierung nicht immer notwendig.

Erfassen und Ablage

Mit dem Programm können Sie beliebig viele Dokumente erfassen. Die Dokumente werden dabei in einer Verzeichnisstruktur auf der Festplatte abgelegt. Dabei werden die Dokumente nicht verschlüsselt. Daher ist es auch möglich, mit dem Explorer auf die Dokumente zuzugreifen. DIEW unterstützt Sie bei der Verwaltung der Verzeichnisstruktur.

Dokumentenscanner

Für eine größere Anzahl von Papierdokumenten lohnt sich der Einsatz eines Dokumentenscanners, der mehrere Seiten hintereinander automatisch scannt. Damit können Sie bis zu 60 Seiten je Minute erfassen. Allerdings kosten diese Scanner wesentlich mehr als ein Flachbettscanner.

Flachbettscanner

Für kleinere Mengen reicht auch ein Flachbettscanner. Diese gibt es in verschiedenen Preis- und Qualitätsstufen. Die Bildqualität ist auch bei billigen Scannern ausreichend. Ein höherer Preis macht sich meist in einer höheren Scann-Geschwindigkeit bemerkbar. Realistische Zeiten sind hier 2-6 Seiten je Minute.

Ein Flachbettscanner scannt immer nur Vorder- oder Rückseite. Vorteil des Flachbettscanners ist es, dass Sie damit auch Bücher oder Zeitschriften o.ä. zerstörungsfrei erfassen können. Um ein Buch mit einen Dokumentenscanner schnell erfassen zu können, müssen Sie es zunächst in Einzelseiten zerlegen. Das mindert natürlich den Wert des Buches und ist nur sinnvoll, wenn Sie das Buch nach dem Scannen entsorgen möchten.

Von daher ist ein Flachbettscanner "Pflicht", der Dokumentenscanner ein "Nice to have".

Kamera

Prinzipiell können Sie auch eine Fotokamera zur Erfassung von Dokumenten verwenden. Dabei treten aber Verzerrungseffekte an den Seiten auf. Eine gleichmäßige Schärfe des Bildes ist nicht selbstverständlich. Ebenso eine einheitliche Skalierung ist nur schwer möglich. Zudem liefert die Kamera Farbbilder - besser sind Schwarzweißbilder im TIF-Format. Das Ergebnis muss also noch konvertiert werden. Dafür ist die Erfassung mit der Kamera schnell und nicht zerstörend. Aber insgesamt nur was für Experten und Tüftler und auch dann nicht für den Alltagsgebrauch.

Falls Sie mit der digitalen Dokumentenverwaltung beginnen und eine paar Aktenordner "Altbestände" haben, sollte Sie sich überlegen, ob es nicht sinnvoll ist, die alten Bestände von einem Scandienstleister erfassen zu lassen und anschließend die Neuzugänge selbst erfassen. Dann ersparen Sie sich eventuell den Kauf und Installation eines Dokumentenscanners.

Wir bieten diesen Service an, aber es gibt auch anderen Anbieter, die Ihnen behilflich sein können.

Nach dem Start des Programms müssen Sie zunächst ein neues Projekt beginnen.

Die Freewareversion verwendet immer das gleiche Verzeichnis zur Ablage von Dokumenten. In der Vollversion können Sie beliebig viele unterschiedliche Verzeichnisse zur Dokumentenablage verwenden.

Um Dokumente abzulegen, wählen Sie einen Ordner innerhalb der Struktur aus. Gegebenenfalls können Sie einen untergeordneten Ordner erstellen.

Danach können die Dokumente mit dem Scanner erfasst werden. DIEW kümmert sich darum, dass die entsprechenden Unterverzeichnisse angelegt werden und die Dokumente dort mit einem geeigneten Dateinamen gelegt werden. Sie können sich auf das Scannen der Dokumente konzentrieren.

DIEW arbeitet aber auch gerne mit einem schnellen Einzugsscanner. Wenn Sie Dokumente in einer hohen Geschwindigkeit erfassen, benötigen Sie einige besondere Verarbeitungsschritte. Die Dokumente können nachträglich überprüft werden. Dabei ist in einem schnellen Durchlauf durch alle neuen Bilder vom Anwender zu entscheiden, ob das Bild in Ordnung ist, noch einmal überprüft werden muss oder gelöscht werden muss. Somit ist nach dem schnellen Erfassen auch eine schnelle Überprüfung möglich.

Bilder von Dokumenten

Das Scannen von Seiten wandelt die Blätter in Bilddateien um. Man ist natürlich bestrebt die Informationen der Blätter möglichst vollständig in die Bilddatei zu übernehmen. Man kann so vorgehen, dass man die Seiten farbig mit hoher Auflösung scannt und auf Platte speichert. Im Sinne der Informationserhaltung wäre das sicherlich gut. Allerdings ein Blick auf die anfallenden Datenmengen zeigt schnell, dass dies kein gangbarer Weg ist. Dateigrößen von 10 MB je Dokumentenseite sind zu viel. Gleich vorweg: Eine allgemein gültige Lösung, die global für alle Anwendungsfälle einsetzbar ist, gibt es nicht. Kleinere Größen der Bilddateien erreicht man durch Datenreduktion. Eine "normal" ausgedruckte Seite ist oft nur ein Schwarz-Weiß-Bild. Die Speicherung der Daten mit gleichzeitiger Reduzierung der Farbinformation ist eine enorme Speicherplatzersparnis. Bei Wahl einer geeigneten Komprimierung lassen sich Dateigrößen nochmals deutlich reduzieren. Dann sind Dateigrößen von ca. 60000 Bytes realistisch. Schwarz-Weiß-Bilder gehören also zu den "guten" Formaten, die mit einem Speicherformat wie TIF-CCITT-Fax 4 kleine handliche Dateien ergeben. Dies entspricht in etwa einer Kopie einer Seite durch einen Kopierer, der ja auch nur Schwarz-Weiß-Farben zur Verfügung hat. In vielen Fällen ist das ausreichend und sind alle Vorlagen einfache kontrastreiche Texte, dann ist das Thema "Bildverarbeitung" beim Dokumentenmanagement auch schon erledigt.

Leider ist es aber auch manchmal so, dass Texte mit einem Nadeldrucker sehr schwach gedruckt wurden, vielleicht noch auf dunklem Hintergrund, dass Thermopapiere ausgebleicht sind ... Dann kann unter Umständen durch eine Korrektur der Belichtung immer noch ein ordentliches Schwarz-Weiß-Bild erstellt werden. Schwieriger ist es, wenn verschiedene Kontrastbereiche auf einer Dokumentenseite vorkommen. Rechts sehen Sie ein typisches Dokument, welches von einem Lieferanten stammt, der sicherlich schon längere Zeit kein neues Farbband in seinen Nadeldrucker eingelegt hat. Das Dokument ist im Original sehr schlecht zu lesen, die Schrift sieht sehr dünn aus ... Dann muss man entweder die Farbtiefe vergrößern (beispielsweise Graustufen verwenden) oder das Bild vorverarbeiten. Es gibt Verfahren z. B. Fehlerdiffusion um Graustufen als Schwarz-Weiß-Bild darzustellen. Schwarze Flächen werden mit schwarzen Punkten zusammengesetzt. Je heller die Fläche wird, umso mehr weiße Punkte werden eingestreut. (Das Verfahren heißt Fehlerdiffusion, weil der Algorithmus, der dabei verwendet wird, aus einem Bildpunkt nach einer festen Schwelle einen schwarzen oder weißen Punkt macht, den sich daraus ergebenden Fehler ermittelt und diesen einen auf die Nachbarpunkte verteilt. Ist ein Punkt dunkelgrau, dann wird dieser schwarz. Das Bild ist damit zu dunkel und somit die Nachbarpunkte etwas aufgehellt.) Aus etwas Abstand betrachtet entsteht dann wieder der Eindruck einer grauen Fläche.

Bild mit Fehlerdiffusion:

Das gleiche Bild verkleinert:

Bei Vorlagen mit normalen Texten und einigen Bildern ist dies ein sehr gutes Verfahren. Nachteil: Text auf grauen Hintergrund wird mit schwarzen Punkten zerfranst, was z. B. eine automatische Texterkennung erschwert. Und es müssen Graustufenbilder gescannt werden, was die Geschwindigkeit der Erfassung reduzieren kann - je nach verwendetem Scanner. Alternativ kann das Bild auch als Graustufenbild gespeichert werden. Eine Reduzierung auf 4 Graustufenwerte bietet meist gute Ergebnisse bei Vorlagen mit verschiedenen Kontrastbereichen.

Das gleiche Bild als Graustufenbild mit 4 Graustufen:

DIEW bietet Ihnen verschiedene Verfahren an, sodass Sie sich nicht mehr allzu große Gedanken über Formate, Belichtung usw. machen müssen. Zusätzlich wird eine automatische Belichtungsanpassung sowie Gamma-Korrektur beim Scannen von Grauwertbildern vorgenommen. DIEW arbeitet mit einfachen Scannern, aber auch mit Hochleistungsscannern zusammen, die bis zu 40 Seiten je Minute per Dokumenteneinzug erfassen.

Kontrolle

Nach dem Scannen von größeren Dokumentenmengen sollten diese noch einmal kontrolliert werden. Ob kleine Zettel auf einer Seite aufgeklebt waren, Belichtung falsch eingestellt war, Eselsohren Informationen verdecken usw. Deshalb enthält DIEW eine besondere Kontrollfunktion, mit der Sie die Dokumente schnell durchblättern können und einen guten Scan bestätigen, einen schlechten markieren. Vor allem beim Einsatz eines Dokumentenscanners ist diese Funktion wichtig.