$30 off During Our Annual Pro Sale. View Details »

ScrumTisch – Wo hört Fehlerkultur auf und fängt Schlamperei an?

ScrumTisch – Wo hört Fehlerkultur auf und fängt Schlamperei an?

Wir bei cosee entwickeln Software. Dabei passieren immer wieder kleine und große Fehler. Und jedes Mal stellt sich die Frage: War das vermeidbar? Haben wir hier einfach nur geschlampt? Andererseits hilft es nicht, jede Entscheidung endlos zu planen und abzusichern. Denn Fehler helfen uns, wichtige Lektionen zu lernen. Wie aber stellen wir das Lernen sicher? Konstantin gibt Beispiele, mit welchen Techniken er und das cosee-Team versuchen, aus Fehlern zu lernen.

Konstantin Diener

June 13, 2019
Tweet

More Decks by Konstantin Diener

Other Decks in Programming

Transcript

  1. Wo hört Fehlerkultur auf und fängt
    Schlamperei an?
    Konstantin Diener | cosee GmbH
    [email protected] | @onkelkodi
    u

    View Slide

  2. KONSTANTIN DIENER
    CTO und Gründer von cosee

    View Slide

  3. Backend Mobile Frontend DevOps Agile Coach

    View Slide

  4. Warum sind Fehler auf einmal cool?

    View Slide

  5. „Wenn wir nur genügend drüber nachdenken, können wir alle Fehler im
    Vorhinein ausschließen …!“

    View Slide

  6. Werner Vogels, Amazon
    „Everything fails all the time“

    View Slide

  7. https://blog.github.com/2018-10-30-oct21-post-incident-analysis/

    View Slide

  8. 43 sec Verbindungsausfall …

    View Slide

  9. … über 24 h Teilausfälle

    View Slide

  10. Facebook
    „Done is better than perfect.“

    View Slide

  11. View Slide

  12. Jeff Patton, User Story Mapping, https://jpattonassociates.com/

    View Slide

  13. Fehler sind schon länger cool.

    View Slide

  14. Nicht: Schuldige bestrafen

    View Slide

  15. Der „Schuldige“ war der Meinung …

    View Slide

  16. • ... das, was als Folge seiner Handlung eingetreten ist, nicht möglich sei.
    • ... oder das, was passiert ist, nichts mit seinen Aktionen zu tun hat
    • ... oder die Erreichung des gemeinsamen Ziels jede Art von Risiko wert ist.

    View Slide

  17. Abschreckung verringert Sicherheit

    View Slide

  18. psychologische Sicherheit

    View Slide

  19. Blameless Culture

    View Slide

  20. https://www.shutterstock.com/de/g/maxym

    View Slide

  21. View Slide

  22. Was bedeutet das?

    View Slide

  23. Fehler #1: User Facing Bug

    View Slide

  24. View Slide

  25. View Slide

  26. View Slide

  27. Lösung: automatisierte Tests

    View Slide

  28. View Slide

  29. Tests nicht ausgeführt!

    View Slide

  30. View Slide

  31. abgelaufenes SSL-Zertifikat

    View Slide

  32. Fehler #2: brandneues Team

    View Slide

  33. View Slide

  34. View Slide

  35. View Slide

  36. View Slide

  37. View Slide

  38. Nicht alle Fehler selbst machen!

    View Slide

  39. https://www.owasp.org/index.php/Top_10-2017_Top_10

    View Slide

  40. Werkzeuge

    View Slide

  41. • Retrospektiven
    • Tests
    • Checklisten

    View Slide

  42. Blameless Postmortems

    View Slide

  43. https://blog.github.com/2018-10-30-oct21-post-incident-analysis/

    View Slide

  44. • User-visible downtime or degradation beyond a certain threshold
    • Data loss of any kind
    • On-call engineer intervention (release rollback, rerouting of traffic, etc.)
    • A resolution time above some threshold
    • A monitoring failure (which usually implies manual incident discovery)

    View Slide

  45. Backend Mobile Frontend DevOps Agile Coach
    > https://cosee.jobs

    View Slide