Document Understanding: Dokumente prozessieren in der Praxis
Im Rahmen einer Heise Academy vorgestellter Ansatz zum Thema Dokumentenverabeitung, automatisiert. Sie haben Fragen? Nehmen Sie gerne Kontakt auf: https://github.com/MoBRUEC
SPIELART DER IA Heise Online 6 “Document understanding is the term used to describe reading, interpreting, and acting on document data automatically.“ (UIPath)
DAS WAS FÜR MICH? Heise Online 9 Haben Sie mit zahlreichen Medienbrüchen zu kämpfen? Keine einheitlichen digitalen Standards in Sicht? Leiden Geschäftsprozesse darunter, was sich wie folgt zeigen könnte: ⬛ Service Level könnten besser sein ⬛ Fehler in dokumentenlastigen Prozessen haben Folgen – Reputation, Reperation, Mehrarbeit Bild austauschen
DAS WAS FÜR MICH? Heise Online 10 Fällt es ihnen schwer, ausreichend Personal anzuheuern? Dauert das Onboarding lange und ist ressourcenintensiv? Dann ist Loyalität wahrscheinlich ein ernstes Thema für Sie – und damit auch Document Understanding. (Was mit DU automatisiert wird, macht keinem wirklich Spass.)
ÜBERHAUPT? Heise Online 11 ⬛ Ein großer Prozentsatz der täglichen Prozesse sind mindestens teilautomatisierbar – Google Cloud Tech: 20%, Arago: 80% ⬛ Kosteneinsparungen von 30%, Steigerung Servicequalität ebenfalls 30% (Gartner) ⬛ Opportunitätskosten, Reputation ⬛ Mitarbeiterloyalität und damit Aufwände für Anheuern, Einarbeiten ⬛ Beeindruckender Case von Google: 60% Einsparungen im Procure-To-Pay von UnifiedPost*, 250% Steigerung der Datenqualität! *) https://cloud.google.com/blog/products/ai-machine-learning/unifiedpost-and-google-partner-on-document-ai
BAUSTEINE VON INTELLIGENT AUTOMATION Heise Online 14 iPAAS Workflow Engine APIs / Integration ML Services wie NLP, OCR, Form Recognition… Prozessanalyse (BPM) + Business Architecture Chatbot AI Engine
IMMER BESSERES DOCUMENT UNDERSTANDING Heise Online 15 Einerseits weil Computer Vision Modelle immer performanter werden… … andererseits, weil Deep Learning Modelle wie GTP-3 das Verständnis von Text und sogar von Grafiken durch Maschinen auf nie dagewesene Niveaus anheben.
Heise Online 18 Gut geeignet • Häufig auftretende Prozesse • Manuelle, sich wiederholende Tätigkeiten • Regelbasierte Tätigkeiten • Standard Input-Typen • Geringe Fälle von Ausnahmen • Elektronisch lesbarer Input Weniger gut geeignet • Selten auftretende Prozesse • Prozesse mit geringem Wert • Keine Standard Input-Typen • Hohe Anzahl von Ausnahmen • Von Medienbrüchen gezeichneter Input Aber auch nicht unmöglich bzw. notwendigerweise unwirtschaftlich - Dank AI!
DOKUMENTENTYPEN SIND WICHTIG Heise Online 19 Strukturierte Dokumente: Gleichmäßig vor-strukturierte Dokumente mit Bausteinen aller Art – Checkboxen, Formularfelder… Semi-strukturiert: Teilweise vorstrukturierte Dokumente, z. B. Rechnungen, Kontoauszüge… Unstrukturiert: Keinerlei vorgegebene Struktur oder Format, z. B. E-Mails und sonstiger Schriftverkehr, Bilder… Sind die Dokumente vom Layout her gleich? Für strukturierte Dokumente empfiehlt sich eine Rules Engine in Kombination mit Templates Kapseln die Dokumente konsistente Informationen, aber in verschiedenen Formen? Rechnungsbelege etwa. NEIN JA NEIN JA Für semi-strukturiert: ML Modelle verwenden, vortrainiert oder eigene, abhängig vom Doc-Typ Für unstrukturiert: vortrainierte und eigene Modelle, evtl. 3rd Party Lösungen
Angebote ⬛ Bestellungen ⬛ Aufträge ⬛ Lieferscheine ⬛ Rechnungen ⬛ Etc. WIE AUTOMATISIEREN: HIER LOHNT SICH DU GANZ BESONDERS Heise Online 21 Document Understanding lohnt sich besonders, wenn genügend inhaltsgleiche Dokumente vorhanden sind: ⬛ Wirtschaftlich besonders interessant, da die Automatisierung mit geringer Ausnahmequote umsetzbar ⬛ Der Case wird weiter unterstützt durch signifikante Medienbrüche ⬛ Welche erfordern, dass eine signifikante Anzahl Mitarbeiter mit der Erfassung und Kontrolle beschäftigt ist ⬛ Zum anderen bietet eine solches Szenario eine gute Grundlage, um schnell Modelle zu trainieren Purchase-to-Pay Dokument ⬛ Schadensmeldung ⬛ Beschwerden ⬛ Reklamationen ⬛ Sonstige Anfragen Abwicklung / Kundeninteraktion ⬛ Technische Anforderungen, z.B. im Baubereich ⬛ Ausschreibungen, in denen technische Eigenschaften benannt werden ⬛ Begleitdokumente im LEH Technische Dokumente ⬛ Tankbelege ⬛ Hotelrechnungen ⬛ Spesenbelege ⬛ Papierarchive ⬛ Selbstauskünfte Physische Belege
VIELFÄLTIG Heise Online 32 C O N T I N U UM Cloud Services a lá Hyperscaler Hyperscaler basierte Anbieterlösungen 3rd party services Azure Cognitive Services AWS Computer Vision AWS Sagemaker Azure ML … Azure Applied AI Services Power Automate AI Builder Google Document AI … Esker SOP Acodis Korper Expert.ai … „BUILD“ „BUY“ „BUY ELSEWHERE“ Maximale Flexibilität Maximal vorangepasst
solution continuum is rich - and diverse Heise Online 33 C O N T I N U UM Cloud Services a lá Hyperscaler Hyperscaler based vendor solutions 3rd party vendor services Azure Cognitive Services AWS Computer Vision AWS Sagemaker Azure ML … Azure Applied AI Services Power Automate AI Builder Google Document AI … Esker SOP Acodis Korper Expert.ai … „BUILD“ „BUY“ „BUY ELSEWHERE“ Max flexibility Max convenience platformeconomies.com
SIND ABER NICHT DIE EIGENTLICHE HERAUSFORDERUNG BEIM AUTOMATISIEREN Heise Online 34 Beratung Change Daten Software Services Modelle 00111010101 11001010010 10101010011 01110111001 01100101010 KI erfordert interdisziplinäres Vorgehen
DESIGN SPRINTS! Heise Online 35 „It is critical to identify a broad and compelling set of cognitive automation opportunities so that the most strategic ones can be included in the roadmap and prioritized appropriately.“ https://www.cognitiveautomation.com/resources/how-to-succeed-in-your-cognitive-automation-transformation