Digitale Transformation
Lösungen
Produkte
Über DocuWare
Persönliche Demo und 30 Tage Testzugang

Richtig scannen und so die Texterkennung verbessern

In Ihrem Geschäftsalltag scannen Sie viele Papierdokumente, zum Beispiel Eingangsrechnungen. Achten Sie dabei auf optimale Einstellungen, dann kann DocuWare die Daten bestmöglich auslesen und Sie müssen nichts nachscannen.

Ob Rechnungen, Lieferscheine oder Verträge: Viele Papierdokumente werden gescannt, bevor sie digital in DocuWare landen. Meist geschieht das zentral an einem Firmen- oder Abteilungsscanner. Je besser die Scanqualität ist, desto besser funktioniert auch das Auslesen von Daten aus den entstandenen digitalen Dokumenten.

Wie schnell und exakt das Auslesen abläuft, hängt maßgeblich von der Scanqualität und damit der Lesbarkeit des Dokuments ab. Und die können Sie schon mit wenigen Einstellungen wie der richtigen Auflösung enorm verbessern.

Welches Dateiformat?

Bei der Frage des Dateiformats ist wichtig, was mit dem gescannten, also digitalisierten Dokument geschehen soll. Aus vielen Dokumenten liest DocuWare beim Importieren Daten aus, um sie für die Indexierung und vielleicht auch in Workflows zu verwenden. Das ist zum Beispiel bei Eingangsrechnungen so. Bei anderen Dokumenten ist das nicht so, beispielsweise bei Plänen, die Sie nur in DocuWare archivieren möchten, damit sie bei Bedarf im DocuWare Client aufgerufen oder als E-Mail-Anhang versendet werden können.

Wenn Text oder Barcodes aus einem Dokument ausgelesen werden sollen, um sie für die weitere Verarbeitung des Dokuments zu verwenden, muss es im Format PDF oder PDF/A vorliegen. Wählen Sie beim Scannen also diese Einstellung.

Soll ein Dokument nur angezeigt oder versandt werden können, stehen Ihnen alle gängigen Dateiformate zur Verfügung, neben PDF und PDF/A sind das zum Beispiel PNG, JPEG oder TIFF. Für das reine Archivieren ist es also egal, welches Ergebnisformat Sie beim Scannen auswählen. Damit auch solche Dokumente gut lesbar auf dem Bildschirm dargestellt werden, sollten Sie aber auch bei diesen für eine optimale Scanqualität wie hier beschrieben sorgen.

Farbmodus je nach Bedarf

Wählen Sie die Farbeinstellung danach aus, was Sie in Ihrem Geschäftsumfeld brauchen: Bei manchen Dokumentarten kann die Einstellung „Farbe“ sinnvoll sein, zum Beispiel wenn Verträge einem Rechtesystem folgend mit unterschiedlichen Stiftfarben unterzeichnet wurden oder wenn Pläne mit einem Farbschema digitalisiert werden. In den meisten Fällen reicht aber der Modus Schwarz-Weiß oder Graustufen völlig aus. Allerdings haben Schwarz-Weiß-Scans den großen Vorteil, dass sie den geringsten Speicherplatz beanspruchen.

Die richtige Auflösung bestimmen

Entscheidend für optimales Indexieren ist die Auflösung des Dokuments. Sie bezeichnet die Punktdichte der Datei und wird in dpi gemessen, „dots per inch“. Für optimale Ergebnisse empfiehlt sich eine Auflösung von mindestens 300 dpi. Bei zu geringer Auflösung können leicht Fehler bei der Zeichenerkennung (OCR) auftreten. Dann wird zum Beispiel „i“ oder „!“statt „I“ ausgelesen oder statt „w“ zweimal ein „v“.

Unterscheiden wir bei der Auflösung nach Farbmodus, sind bei Schwarz-weiß-Scans 300 oder 400 dpi zu empfehlen. Für Graustufen- und Farbscans genügen häufig bereits 150 bis 300 dpi.

Ein weiterer Faktor ist die Schriftgröße des Dokuments. Nehmen Sie als Richtwert: Je kleiner die Schrift, desto höher sollte die Auflösung sein.

Auflösung_DE

Im Schwarz-Weiß-Modus werden die Buchstaben „Ilti“ erst ab 300 dpi klar erfasst. Im Graustufen-Modus sind die Zeichen zwar schon bei 75 dpi gut zu erkennen, es kommen aber Bildinformationen mit, wie hier die Struktur des Papiers, die die Datei vergrößern und unnötig Speicherplatz beanspruchen.

 

Beste Bedingungen für schnelles und exaktes Auslesen

Wenn Sie all diese Faktoren optimal einstellen, erhalten Sie beim Importieren gescannter Dokumente in DocuWare in der kürzesten Zeit das bestmögliche Ergebnis. Ist beim Auslesen nämlich nicht eindeutig zu entscheiden, ob es sich bei einem Zeichen zum Beispiel um eine 1 oder ein L handelt, braucht dieser Vorgang mehr Zeit und die Performance leidet. Es lohnt sich also, für die richtigen Einstellungen beim Scannen und damit für die beste Datenqualität Ihrer Dokumente zu sorgen.

Lesen Sie auch, wie Sie Ihre gescannten Dokumente automatisch in DocuWare importieren.

 

Kommentar