Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Document Understanding: Dokumente prozessieren ...

Document Understanding: Dokumente prozessieren in der Praxis

Im Rahmen einer Heise Academy vorgestellter Ansatz zum Thema Dokumentenverabeitung, automatisiert. Sie haben Fragen? Nehmen Sie gerne Kontakt auf: https://github.com/MoBRUEC

Das Video dazu:
https://www.youtube.com/watch?v=66LHGCxbs7c

Avatar for Mohammed Brueckner

Mohammed Brueckner

November 23, 2021
Tweet

More Decks by Mohammed Brueckner

Other Decks in Technology

Transcript

  1. © OPITZ CONSULTING 2021 / Interner Gebrauch Heise Online 1

    02.10.2021 Mohammed Brückner DOCUMENT UNDERSTANDING ALS TEIL VON INTELLIGENT AUTOMATION MoeBrueC github.com/mobruec
  2. © OPITZ CONSULTING 2021 / Interner Gebrauch Heise Online 2

    DARUM GEHT ES ⬛ Was ist Intelligent Automation? ⬛ Warum sollte sich jemand dafür interessieren? 1
  3. © OPITZ CONSULTING 2021 / Interner Gebrauch WAS IST DENN

    “INTELLIGENT AUTOMATION”? Heise Online 3 Ein Avatar erklärt. Video sehen: http://bit.do/was-ist-IA
  4. © OPITZ CONSULTING 2021 / Interner Gebrauch DREI WESENTLICHE WEGE,

    ML ZU OPERATIONALISIEREN Heise Online 4 STRATEGISCHE STEUERUNG OPERATIVE STEUERUNG INTELLIGENTE AUTOMATISIERUNG
  5. © OPITZ CONSULTING 2021 / Interner Gebrauch DOCUMENT UNDERSTANDING, EINE

    SPIELART DER IA Heise Online 5 Intelligent Automation Conversational AI Document Understanding Anomalieerkennung ... Log Files Telemetrik … NLP OCR Entity Extraction …
  6. © OPITZ CONSULTING 2021 / Interner Gebrauch DOCUMENT UNDERSTANDING, EINE

    SPIELART DER IA Heise Online 6 “Document understanding is the term used to describe reading, interpreting, and acting on document data automatically.“ (UIPath)
  7. © OPITZ CONSULTING 2021 / Interner Gebrauch DOCUMENT UNDERSTANDING… IST

    DAS WAS FÜR MICH? Heise Online 9 Haben Sie mit zahlreichen Medienbrüchen zu kämpfen? Keine einheitlichen digitalen Standards in Sicht? Leiden Geschäftsprozesse darunter, was sich wie folgt zeigen könnte: ⬛ Service Level könnten besser sein ⬛ Fehler in dokumentenlastigen Prozessen haben Folgen – Reputation, Reperation, Mehrarbeit Bild austauschen
  8. © OPITZ CONSULTING 2021 / Interner Gebrauch DOCUMENT UNDERSTANDING… IST

    DAS WAS FÜR MICH? Heise Online 10 Fällt es ihnen schwer, ausreichend Personal anzuheuern? Dauert das Onboarding lange und ist ressourcenintensiv? Dann ist Loyalität wahrscheinlich ein ernstes Thema für Sie – und damit auch Document Understanding. (Was mit DU automatisiert wird, macht keinem wirklich Spass.)
  9. © OPITZ CONSULTING 2021 / Interner Gebrauch LOHNT SICH DAS

    ÜBERHAUPT? Heise Online 11 ⬛ Ein großer Prozentsatz der täglichen Prozesse sind mindestens teilautomatisierbar – Google Cloud Tech: 20%, Arago: 80% ⬛ Kosteneinsparungen von 30%, Steigerung Servicequalität ebenfalls 30% (Gartner) ⬛ Opportunitätskosten, Reputation ⬛ Mitarbeiterloyalität und damit Aufwände für Anheuern, Einarbeiten ⬛ Beeindruckender Case von Google: 60% Einsparungen im Procure-To-Pay von UnifiedPost*, 250% Steigerung der Datenqualität! *) https://cloud.google.com/blog/products/ai-machine-learning/unifiedpost-and-google-partner-on-document-ai
  10. © OPITZ CONSULTING 2021 / Interner Gebrauch Heise Online 12

    INTELLIGENT AUTOMATION LEBEN ⬛ Viele Themen zu meistern ⬛ Warum Low Code hilft 2
  11. © OPITZ CONSULTING 2021 / Interner Gebrauch DAS SIND DIE

    BAUSTEINE VON INTELLIGENT AUTOMATION Heise Online 14 iPAAS Workflow Engine APIs / Integration ML Services wie NLP, OCR, Form Recognition… Prozessanalyse (BPM) + Business Architecture Chatbot AI Engine
  12. © OPITZ CONSULTING 2021 / Interner Gebrauch DIE ZUKUNFT VERSPRICHT

    IMMER BESSERES DOCUMENT UNDERSTANDING Heise Online 15 Einerseits weil Computer Vision Modelle immer performanter werden… … andererseits, weil Deep Learning Modelle wie GTP-3 das Verständnis von Text und sogar von Grafiken durch Maschinen auf nie dagewesene Niveaus anheben.
  13. © OPITZ CONSULTING 2021 / Interner Gebrauch DIE IT-TRENDS ALLGEMEINHIN

    KOMMEN INTELLIGENT AUTOMATION ENTGEGEN Heise Online 16
  14. © OPITZ CONSULTING 2021 / Interner Gebrauch EINE GUTE AUTOMATISIERUNG

    IST GUT ORCHESTRIERT UND LÄDT ZUM MITBAUEN EIN – DANK LOW CODE Heise Online 17
  15. © OPITZ CONSULTING 2021 / Interner Gebrauch WAS ÜBERHAUPT AUTOMATISIEREN?

    Heise Online 18 Gut geeignet • Häufig auftretende Prozesse • Manuelle, sich wiederholende Tätigkeiten • Regelbasierte Tätigkeiten • Standard Input-Typen • Geringe Fälle von Ausnahmen • Elektronisch lesbarer Input Weniger gut geeignet • Selten auftretende Prozesse • Prozesse mit geringem Wert • Keine Standard Input-Typen • Hohe Anzahl von Ausnahmen • Von Medienbrüchen gezeichneter Input Aber auch nicht unmöglich bzw. notwendigerweise unwirtschaftlich - Dank AI!
  16. © OPITZ CONSULTING 2021 / Interner Gebrauch WIE AUTOMATISIEREN: DIE

    DOKUMENTENTYPEN SIND WICHTIG Heise Online 19 Strukturierte Dokumente: Gleichmäßig vor-strukturierte Dokumente mit Bausteinen aller Art – Checkboxen, Formularfelder… Semi-strukturiert: Teilweise vorstrukturierte Dokumente, z. B. Rechnungen, Kontoauszüge… Unstrukturiert: Keinerlei vorgegebene Struktur oder Format, z. B. E-Mails und sonstiger Schriftverkehr, Bilder… Sind die Dokumente vom Layout her gleich? Für strukturierte Dokumente empfiehlt sich eine Rules Engine in Kombination mit Templates Kapseln die Dokumente konsistente Informationen, aber in verschiedenen Formen? Rechnungsbelege etwa. NEIN JA NEIN JA Für semi-strukturiert: ML Modelle verwenden, vortrainiert oder eigene, abhängig vom Doc-Typ Für unstrukturiert: vortrainierte und eigene Modelle, evtl. 3rd Party Lösungen
  17. © OPITZ CONSULTING 2021 / Interner Gebrauch WIE AUTOMATISIEREN: WELCHE

    FORM VON AUTOMATISIERUNG WOFÜR? Heise Online 20
  18. © OPITZ CONSULTING 2021 / Interner Gebrauch ⬛ Anfragen ⬛

    Angebote ⬛ Bestellungen ⬛ Aufträge ⬛ Lieferscheine ⬛ Rechnungen ⬛ Etc. WIE AUTOMATISIEREN: HIER LOHNT SICH DU GANZ BESONDERS Heise Online 21 Document Understanding lohnt sich besonders, wenn genügend inhaltsgleiche Dokumente vorhanden sind: ⬛ Wirtschaftlich besonders interessant, da die Automatisierung mit geringer Ausnahmequote umsetzbar ⬛ Der Case wird weiter unterstützt durch signifikante Medienbrüche ⬛ Welche erfordern, dass eine signifikante Anzahl Mitarbeiter mit der Erfassung und Kontrolle beschäftigt ist ⬛ Zum anderen bietet eine solches Szenario eine gute Grundlage, um schnell Modelle zu trainieren Purchase-to-Pay Dokument ⬛ Schadensmeldung ⬛ Beschwerden ⬛ Reklamationen ⬛ Sonstige Anfragen Abwicklung / Kundeninteraktion ⬛ Technische Anforderungen, z.B. im Baubereich ⬛ Ausschreibungen, in denen technische Eigenschaften benannt werden ⬛ Begleitdokumente im LEH Technische Dokumente ⬛ Tankbelege ⬛ Hotelrechnungen ⬛ Spesenbelege ⬛ Papierarchive ⬛ Selbstauskünfte Physische Belege
  19. © OPITZ CONSULTING 2021 / Interner Gebrauch WIE AUTOMATISIEREN: DAS

    GÄNGIGE PROZEDERE Heise Online 22 NLP OCR Entity Extraction (Custom) Computer Vision
  20. © OPITZ CONSULTING 2021 / Interner Gebrauch WIE AUTOMATISIEREN: REGELN,

    TEMPLATES UND ML Heise Online 23 Regeln und Templates Machine Learning Modelle Hybrider Ansatz
  21. © OPITZ CONSULTING 2021 / Interner Gebrauch Heise Online 24

    AB IN DEN MASCHINENRAUM ⬛ Ein Blick auf mögliche Lösungen ⬛ Definitiv etwas für Technik-Aficionados 3
  22. © OPITZ CONSULTING 2021 / Interner Gebrauch IN DEN MASCHINENRAUM

    MIT DOCUMENT UNDERSTANDING AI Heise Online
  23. © OPITZ CONSULTING 2021 / Interner Gebrauch IN DEN MASCHINENRAUM

    MIT AWS UND DER DU REF. ARCHITEKTUR Heise Online
  24. © OPITZ CONSULTING 2021 / Interner Gebrauch IM MASCHINENRAUM –

    MIT AI BUILDER: AB IN DEN WORKFLOW Heise Online
  25. © OPITZ CONSULTING 2021 / Interner Gebrauch HÄTTE MAN AUCH

    NOCH MACHEN KÖNNEN: WEITERE COMPUTER VISION SERVICES EINBINDEN Heise Online 31
  26. © OPITZ CONSULTING 2021 / Interner Gebrauch DIE LÖSUNGSLANDSCHAFT IST

    VIELFÄLTIG Heise Online 32 C O N T I N U UM Cloud Services a lá Hyperscaler Hyperscaler basierte Anbieterlösungen 3rd party services Azure Cognitive Services AWS Computer Vision AWS Sagemaker Azure ML … Azure Applied AI Services Power Automate AI Builder Google Document AI … Esker SOP Acodis Korper Expert.ai … „BUILD“ „BUY“ „BUY ELSEWHERE“ Maximale Flexibilität Maximal vorangepasst
  27. © OPITZ CONSULTING 2021 / Interner Gebrauch The document processing

    solution continuum is rich - and diverse Heise Online 33 C O N T I N U UM Cloud Services a lá Hyperscaler Hyperscaler based vendor solutions 3rd party vendor services Azure Cognitive Services AWS Computer Vision AWS Sagemaker Azure ML … Azure Applied AI Services Power Automate AI Builder Google Document AI … Esker SOP Acodis Korper Expert.ai … „BUILD“ „BUY“ „BUY ELSEWHERE“ Max flexibility Max convenience platformeconomies.com
  28. © OPITZ CONSULTING 2021 / Interner Gebrauch WAS UND WIE

    SIND ABER NICHT DIE EIGENTLICHE HERAUSFORDERUNG BEIM AUTOMATISIEREN Heise Online 34 Beratung Change Daten Software Services Modelle 00111010101 11001010010 10101010011 01110111001 01100101010 KI erfordert interdisziplinäres Vorgehen
  29. © OPITZ CONSULTING 2021 / Interner Gebrauch DIE LÖSUNG: 33A

    DESIGN SPRINTS! Heise Online 35 „It is critical to identify a broad and compelling set of cognitive automation opportunities so that the most strategic ones can be included in the roadmap and prioritized appropriately.“ https://www.cognitiveautomation.com/resources/how-to-succeed-in-your-cognitive-automation-transformation
  30. © OPITZ CONSULTING 2021 / Interner Gebrauch DIE LÖSUNG: 33A

    DESIGN SPRINTS! Heise Online 36 Funktioniert offline wie online!
  31. © OPITZ CONSULTING 2021 / Interner Gebrauch Heise Online 37

    VIEL SPASS NOCH AUF DIESEM EVENT! UND DRAN DENKEN: http://bit.do/intelligentautomation Mohammed Brückner MoeBrueC github.com/mobruec