1
Balans tussen snelheid
en controle
Big Data Expo
12 september 2023
Slide 2
Slide 2 text
2
Antal Nusselder | Data bewonderaar, muzikant en Rockstar Data Scientist
Slide 3
Slide 3 text
Governance &
control als
versneller
Slide 4
Slide 4 text
4
4
Zie je soms op tegen het doorlopen
van een model review proces?
Vraag:
JA NEE
Hand omhoog Hand omlaag
Ik wil graag handen zien!
Slide 5
Slide 5 text
5
Bijna 100 jaar direct verzekeren
zonder gedoe. Ja, dat is OHRA!
Slide 6
Slide 6 text
6
6
OHRA’s datastrategie
Fail fast
Kort cyclisch dingen uitproberen en stoppen
Build first, buy smart(er)
Eerst zelf proberen, dan verder kijken
Best-in-class process
Een soepel en betrouwbaar delivery proces
Iteratief werken | Aansluiten bij de business
Slide 7
Slide 7 text
Maar...
er komt nogal
wat op ons af!
Slide 8
Slide 8 text
8
• vanuit de klant
• vanuit de business
Vraag neemt toe Complexiteit neemt toe
Toepassingsgebieden nemen toe
Regelgeving neemt toe
• processen
• technieken
• van strategisch...
• ...naar operationeel
• intern
• extern
Uitdagende ontwikkelingen
Slide 9
Slide 9 text
9
9
• Reproduceerbaarheid
• 'Vergeten beslissingen'
• Vinden van talent
• Aansluiten bij IT
Naast onze eigen
uitdagingen
Slide 10
Slide 10 text
10
Controle
Verantwoorde dataproducten
en voldoen aan regelgeving.
Wendbaar
Zonder onze slagvaardigheid
te verliezen.
Klinkt
als een
dilemma?
Slide 11
Slide 11 text
Breng je ideale
proces in kaart
Wanneer?
Slide 12
Slide 12 text
12
• Idee voor dataproduct genereren
• Samen met de opdrachtgever
• Iteratief werken aan het dataproduct
• Presenteer definitieve resultaten aan je stakeholders
• Go / no-go moment
• In gebruikname
• Kan verschillende vormen hebben
• Inrichten van monitoring en alerting
• Afspraken over jaarlijkse review
Als het af is, is het nog niet af…
Generatie ideeën
In uitvoering
Resultaten
presenteren
Oplevering
Lifecycle
management
Slide 13
Slide 13 text
Formaliseer en
standaardiseer je
vastlegging
Wat, hoe en (liefst ook) waar?
Slide 14
Slide 14 text
14
Generatie ideeën
In uitvoering
Resultaten
presenteren
Oplevering
Lifecycle
management
Peer review Datakwaliteit
Bias analyse
Monitoring /
alerting
Model
documentatie
Proces
documentatie
Intake
documentatie
Robuustheid
Uitlegbaarheid
Data
minimalisatie
Jaarlijkse review
Slide 15
Slide 15 text
Neem je
stakeholders mee
Wie?
Slide 16
Slide 16 text
16
16
Legal Compliance Risk Merk / PR Management
Stem je proces af
Wie wordt
wanneer
betrokken?
In welke rol?
Stem
mogelijke vragen
vooraf af
16
Slide 17
Slide 17 text
Ondersteun met tools
Slide 18
Slide 18 text
18
18
✔ Geen discussies over definities
✔ Altijd hetzelfde toegepast
✔ Bruikbaar door non-coders
✔ Scheelt typwerk
Herbruikbare code
Slide 19
Slide 19 text
19
19
Feature stores
✔ Feature definities duidelijk
✔ Bekende DQ issues oplossen
✔ Discovery
✔ Starters snel productief
✔ Vlug van start met analyse
Slide 20
Slide 20 text
Wij deden dat met Dataiku
✔ Visueel én coding; iedereen kan meedoen
✔ Herbruikbare code met plugins
✔ Vastlegging in wikis & conversations
✔ Feature Store opbouwen met visuele Flow
✔ Templates vullen met macros
Slide 21
Slide 21 text
21
Ingrediënten: controle én versnelling
✔ Governance by design
✔ Duidelijkheid proces
✔ Niet het wiel telkens opnieuw uitvinden
✔ Vergelijkbaarheid over projecten heen
✔ Nieuw talent sneller productief
✔ Soepel proces met stakeholders