Der Verzicht
auf Papier beschleunigt Prozesse und erhöht die Auskunftsfähigkeit im Unternehmen. Die bloße elektronische Ablage oder Volltextindizierung reicht hierbei allerdings nicht aus. Archive, in denen tausende von Schriftstücken nur über Kopfdaten und Volltext gefunden werden können, erhöhen nicht die Transparenz, sondern führen zu einem Datengrab.
Für die zielführende Suche wird der sachliche Zusammenhang der Dokumente benötigt, also die Zuordnung zum Kunden, Projekt, Schadensfall oder zur Bestellung. Bei der automatischen Erkennung besteht die Herausforderung in einer intelligenten Analyse von Text, Layout und Dokumentenstruktur, um die Inhalte zu ermitteln, die für die weitere Verarbeitung erforderlich sind.
Die Motivation für die automatische Dokumentverarbeitung ist die Kostensenkung, die Beschleunigung von Verteilprozessen sowie die Zentralisierung von Verarbeitungs- und Korrekturregeln. Im Idealfall ist eine sogenannte Dunkelverarbeitung völlig ohne manuellen Eingriff möglich. Paradebeispiel hierfür ist die Eingangsrechnung: Existiert in der unternehmensweiten Standardsoftware eine passende Bestellung sowie ein passender Wareneingang (ERP), kann eine automatisierte Buchung ohne manuelle Prüfungen erfolgen.
Die Aufgaben für die OCR-Verarbeitung (Optical Character Recognition) variieren. Benötigt der Anwender nur eine Inhaltssuche, hilft bereits eine Volltext-Erkennung. Die Erkennungsrate steht dabei nicht im Vordergrund, da mögliche Fehler nicht korrigiert werden. Zielformat ist typischerweise PDF, da hier der Text als Layer hinter die Grafiken gelegt und in die Volltext-Datenbank übernommen werden kann. Dieser Lösungsansatz eignet sich allerdings nicht für alle Dokumentarten. Kaufmännische Schriftstücke werden meist über strukturierte Daten wie Rechnungs- oder Bestellnummer abgelegt.
Bei einem elektronischen Postkorb müssen aus den gescannten Dokumenten komplexe Informationen wie Bestellnummern, Adressdaten, Rechnungspositionen manuell in eine Dokumentenmanagement- oder Fachanwendung erfasst werden. Einfach zu bedienende OCR-Lösungen sparen Tipparbeit: Der Benutzer markiert einen Bereich auf dem Dokument und übernimmt die Inhalte per Copy&Paste in die Anwendung.
Anspruchsvoller wird es, wenn die Daten automatisiert ausgelesen werden sollen. Bei standardisierten und stark strukturierten Schriftstücken wie Meldezetteln oder Bestellformularen lässt sich exakt definieren, an welcher Stelle sich welcher Wert befindet. Darüber hinaus können individuelle feldbezogene Regeln definiert werden, wie etwa die Prüfung von gelesenen Daten gegen Hintergrundsysteme.
Besitzen Dokumente keine feste Struktur, ist eine formularbasierte Definition von Leseregeln nicht möglich. Die relevanten Informationen in einer Rechnung befinden sich je nach Lieferant immer an unterschiedlichen Positionen. Hier wäre es unsinnig, eine formularbasierte Software einzusetzen, da unter Umständen für jeden Kreditor und jede Rechnungsvariante eine eigene Formulardefinitionen erstellt und gepflegt werden müsste. Gefordert sind stattdessen Produkte, die den erkannten Text anhand von Vorgaben analysieren. Diese sogenannte Freiformerkennung arbeitet auf Basis von Regeln, die wie folgt aussehen:
• Eine Rechnungsnummer befindet sich hinter oder unter Texten, wie „Rech-Nr.:", „Rechnungsnummer" oder „Unser Zeichen".
• Bei einem numerischen Wert mit dem Aufbau „xx-xxxx-xx" und der Länge 8 handelt es sich um eine Schadennummer.
• Bei der Kontonummer „130328" handelt es sich um den Kreditor „Abrechnungsstelle XY AG". Solche Regeln hinterlegen Anwender zum Beispiel dann, wenn von diesem Kreditor ein besonders hoher Anteil von Rechnungen zu erwarten ist.
Viele Anwender wünschen eine automatisierte Verarbeitung der Eingangspost. Das Beleggut unterscheidet sich nach Form und Inhalt, und je nach Dokumentart sind unterschiedliche Inhalte von Interesse. Für einen Eingangsbrief kann beispielsweise ausschließlich der interne Ansprechpartner für die Weiterleitung relevant sein, für Eingangsrechnungen sind hingegen die offiziellen Mindestangaben das Ablagekriterium. Vor dem Auslesen von relevanten Feldern ist daher eine elektronische Klassifizierung in die unterschiedlichen Dokumentarten nötig.
Die Klassifikation in Dokumentarten oder Vorgangstypen gestaltet sich alles andere als trivial. Nicht immer sind alle Entscheidungskriterien eindeutig interpretierbar. Dokumente mit der Phrase „hiermit kündige ich", sind nicht in jedem Fall Kündigungen, wie folgendes Beispiel zeigt: „hiermit kündige ich an, dass ich den Vertrag verlängern werde". Außerdem ist das Wort „Kündigung" häufig in Verträgen bei der Vereinbarung von Kündigungsfristen anzutreffen.
Eine automatisierte Erfassung von Papierdokumenten erfordert eine Zentralisierung des Posteingangs, um Skaleneffekte bezüglich Belegvolumen, gleichartiger Dokumenttypen und damit verbundener Dokumentvorbereitung auszunutzen. Zentrale Erfassungsteams können besser Know-how über das zu verarbeitende Beleggut aufbauen und Lastspitzen, Urlaubsvertretung oder Fehlzeiten wegen Krankheit besser abfangen. Bei dezentral organisierten Unternehmen kann dies organisatorische Veränderungen mit sich bringen.
Die Erkennungsleistung lässt sich an der Qualität der bereitgestellten Daten und der Minimierung der manuellen Nachbearbeitung messen. Unerlässlich für die Qualitätssicherung ist die Validierung gelesener Informationen in Fachanwendungen. Hierbei wird beispielsweise geprüft, ob die gelesene Bestellnummer oder die erkannte Kundennummer im ERP-System existieren. Oft können Syntax-Definitionen, Summenprüfungen oder einfache Berechnungen zur Validierung und Verbesserung der Ergebnisse führen. In kritischen Anwendungsszenarien kann der Einsatz von Voting-Verfahren sinnvoll sein. Hierbei erarbeiten mehrere OCR-Engines parallel Ergebnisse und stellen diese gewichtet zur Verfügung.
Auch die Anwender müssen in den Optimierungsprozess eingreifen. Bei manuellen Korrekturen hinsichtlich der Klassifikation oder den erkannten Werten sollte die Anwendung für die zukünftige Verarbeitung trainiert werden. Beispiele für formularspezifische Regeldefinitionen sind: „Bei der Müller AG steht die Rechnungsnummer unter dem Text „SAP-Nr." oder „Bei Dokumenten mit dem Begriff „kündige" ist ein manueller Eingriff vor der Klassifikation erforderlich". Ein wichtiges Kriterium bei Auswahl einer Lösung ist die Prüfung, wie einfach die Werkzeuge zur Nachbearbeitung zu bedienen sind.
Auch ein Blick auf das Beleggut selbst ist sinnvoll: Bei Dokumenten von Lieferanten oder Kunden sind die Möglichkeiten der Optimierung oft beschränkt. Anders verhält es sich allerdings bei Rückläufern, also selbst erstellten Dokumenten, die wieder in das Unternehmen zurückkommen. Hier lässt sich die Erkennungsqualität beispielsweise über einen Barcode-Aufdruck erhöhen.
Auch wenn die optische Erkennung perfekt arbeitet, treten in der Praxis Stolpersteine auf: Dies fängt bereits bei der Trennung der einzelnen Dokumente im Scan-Stapel an. Gemischtes Beleggut verlangt oftmals ein manuelles Zusortieren von Trennblättern, da die Software-Regeln für die Erkennung von Dokumentgrenzen nicht richtig greifen. Schwierig wird es auch bei der Mehrfachklassifikation von Dokumenten, also der Identifikation mehrerer Geschäftsvorfälle in einem Dokument. Hier lassen sich Dokumentenklassen nicht immer ausreichend genau unterscheiden. Wichtig sind dann aussagefähige Statistik-Funktionen, um schnell einen Überblick über typische Problemfälle zu bekommen.
Bei Aussagen zur Erkennungsrate ist immer die Bezugsgröße wichtig: Geht es um Dokumente, Seiten, Felder oder Zeichen? Bei einer Modellrechnung mit 500 Belegen von je zwei Seiten mit 1000 Seiten und jeweils drei Feldern pro Seite zeigt sich, dass ein deutlicher Unterschied für die Nachbearbeitung entstehen kann. Im schlimmsten Fall ist fast die Hälfte der Belege zu korrigieren. So schlecht sind die Erkennungsraten in der Praxis nicht. Dennoch sollte man bei der Erkennungsrate ins Detail gehen.
Allgemeine Produkt-Demos oder lange Feature-Listen helfen bei der Auswahl nur wenig. Viel wichtiger ist die Prüfung mit eigenen, repräsentativen Dokumentstapeln, die idealerweise mit den eigenen Scannern digitalisiert wurden. Der Anbieter sollte das Regelwerk für die Erkennung und Prüfung vorab bekommen, um sein System vortrainieren zu können.
Bei einer Produkt-Demonstration im Haus empfiehlt sich die Übergabe eines weiteren Dokumentstapels. Beim zweiten Stapel sollten die Optimierungen, die der Anbieter für den ersten Stapel eingegeben hat, bereits berücksichtigt werden. Nach der Verarbeitung kann im Detail verglichen, geprüft und gezählt werden. Möglich ist auch eine Bewertung, wie einfach sich Korrekturen gestalten.