9. Oktober 2023 von Leonie Prümm
Document Understanding: Der Schlüssel zur intelligenten Verarbeitung von Informationen
In der heutigen digitalen Welt werden enorme Mengen an Informationen und Dokumenten generiert. Diese Informationen (zeit-)effizient zu verarbeiten ist entscheidend für den Geschäftserfolg. Was uns Menschen leichtfällt, ist für Roboter oft besonders schwierig – und umgekehrt. Während wir verschiedenste Dokumente leicht verstehen und einordnen können, fällt uns das Abarbeiten tausender Formulare schwer. Die Konzentration lässt nach und Fehler schleichen sich ein. Hier kommt Document Understanding ins Spiel. Mithilfe von Document Understanding können verschiedene Dokumente wie Verträge, Rechnungen und Formulare kategorisiert und analysiert sowie relevante Informationen extrahiert werden. Document Understanding bietet somit die Möglichkeit, bereits teilautomatisierte dokumentengestützte Prozesse durch intelligente Entscheidungsfindung zu ergänzen. Infolgedessen können weitere Prozessschritte automatisiert werden, die bisher manuell und zeitintensiv waren. Außerdem wird eine Datenbasis geschaffen, auf deren Grundlage Analysen und Prognosen durchgeführt werden können.
Was ist Document Understanding?
Document Understanding (oft auch Document Processing oder Intelligent Document Processing genannt) ist eine Technologie, die es Computern ermöglicht, Dokumente zu verstehen und Informationen aus ihnen zu extrahieren. Um dies zu erreichen, werden Konzepte aus den Bereichen Künstliche Intelligenz (KI) und maschinelles Lernen, wie beispielsweise Computer Vision oder Natural Language Processing (NLP), genutzt. Um den Inhalt und die Zusammenhänge eines Dokuments zu verstehen, ist es unerlässlich, Technologien zu kombinieren. Sowohl strukturierte (zum Beispiel ein standardisiertes Formular) als auch semistrukturierte (etwa ein Bahnticket) und unstrukturierte Dokumente (beispielsweise ein Blog-Beitrag) können verarbeitet werden. Neben digital erstellten (nativen) Dokumenten können zudem eingescannte Dokumente analysiert werden.
Der Prozess des Document Understanding beginnt mit der Dokumentenerfassung, bei der die Dokumente digitalisiert und in eine maschinenlesbare Form gebracht werden. Anschließend erfolgt die automatische Klassifizierung der Dokumente, um ihren Typ und Inhalt zu bestimmen, falls es mehr als einen Dokumententyp gibt. Dann werden Texterkennungstechnologien eingesetzt, um den Text zu extrahieren und zu verstehen. Schließlich erfolgt die Informationsextraktion. Dabei werden relevante Informationen wie Namen, Daten, Beträge oder andere spezifische Informationen identifiziert und in strukturierten Formaten gespeichert – zu sehen in der folgenden Abbildung:
Wie kann Document Understanding eingesetzt werden?
Document Understanding kann in Robotic Process Automation (RPA) mit Werkzeugen wie UiPath integriert werden. Software-Roboter, die stark regelbasiert agieren, werden somit um intelligente Entscheidungsmöglichkeiten erweitert. Der Software-Roboter generiert dabei die Datenbasis, auf der er Entscheidungen trifft, selbst. Beispielsweise kann ein Software-Roboter eingesetzt werden, um Kunden-E-Mails zu verarbeiten (vergleiche Abbildung 3). Eine Kundin oder ein Kunde sendet eine Mail mit einem eingescannten Antrag für eine Krankenversicherung als PDF. Der Roboter verarbeitet die E Mail und speichert die PDF-Datei im vorgesehenen Ordner. Ohne Document Understanding müsste an dieser Stelle nun ein Mensch eingreifen, um die Datei zu lesen, zu verstehen und die relevanten Daten in die entsprechende Software zu übertragen. Dank Document Understanding kann ein Roboter jetzt diese Aufgabe übernehmen. Er digitalisiert das eingescannte PDF-Dokument, klassifiziert es als Antragsformular und extrahiert den Text. Aus dem Text werden dann Kundendaten wie Name, Versicherungsbeginn und Versicherungstyp extrahiert und gespeichert. Nach Antragsaufnahme kann nun eine menschliche Mitarbeiterin oder ein menschlicher Mitarbeiter eingeschaltet werden, die oder der sich mit der Antragsprüfung auseinandersetzt. Im Folgenden kann der Mitarbeiterin oder dem Mitarbeiter prognostiziert werden, ob der Antrag plausibel ist und an welchen Stellen Unklarheiten existieren.
Was wird Document Understanding verändern?
Viele Geschäftsprozesse sind heute noch stark dokumentenbasiert. Diese Dokumente liegen oft nur in analoger Form vor und müssen in mühsamer Handarbeit abgetippt und in bestehende Systeme eingepflegt werden. Der Mensch ist für solche Tätigkeiten nicht geschaffen: Sie machen uns oft weder Spaß noch arbeiten wir daran über längere Zeit konzentriert und fehlerfrei. Mit Document Understanding werden dokumentenbasierte Prozesse zukünftig „end to end“ automatisiert, sodass menschliches Eingreifen nur noch in Ausnahmefällen erforderlich ist.
Für Mitarbeitende hat das zur Folge, dass sie ihre Arbeitszeit zukünftig für kreative, kommunikative oder komplexe Aufgaben statt für stupide Fleißarbeit nutzen können. Für Robotic Process Automation bedeutet das, dass Roboter sich von regelbasiertem Verhalten zu intelligenter Entscheidungsfindung weiterentwickeln. Document Understanding in Kombination mit RPA wird das Spektrum an automatisierbaren Prozessen erweitern. Damit trägt es zum RPA-Ziel bei, repetitive Prozesse mit hohem Volumen zu automatisieren. Insgesamt wird Document Understanding eine entscheidende Rolle bei der Bewältigung der Informationsflut spielen und Unternehmen dabei unterstützen, fundierte Entscheidungen zu treffen. Es ist ein spannender Schritt in Richtung intelligenterer Informationsverarbeitung, der die Arbeitsweise von Unternehmen nachhaltig verändern wird.
Auch interessant: