$30 off During Our Annual Pro Sale. View Details »

클라우드 시대에 맞는 사이트 신뢰성 엔지니어

Outsider
November 22, 2022

클라우드 시대에 맞는 사이트 신뢰성 엔지니어

DevOps가 중요해지고 퍼블릭 클라우드가 주류가 되면서 인프라스트럭처 관련 업무의 방식도 달라지고 있습니다. 무엇이 달라지고 있고 SRE라는 역할은 어떤 일을 하고 있는지를 설명합니다.

Outsider

November 22, 2022
Tweet

More Decks by Outsider

Other Decks in Programming

Transcript

  1. 당근마켓 SRE Outsider 클라우드 시대에 맞는 사이트 신뢰성 엔지니어

  2. Google에서 쓴 사이트 신뢰성 엔지니어 링

  3. Infra Engineer Cloud Engineer DevOps Engineer ⬥ ⬥ ⬥ Site

    Reliability Engineer ⬥ ….
  4. Infrastructure

  5. Engineer Site Reliability Engineer

  6. DevOps

  7. None
  8. Google Cloud Tech “What's the Difference Between DevOps and SRE?”

    class SRE implements DevOps
  9. Does it work well? Site Reliability Does it work? Site

    Reliability Engineering at Facebook Could it work better? Engineering
  10. Could it work better? Does it work well? Site Reliability

    Engineering Does it work? Site Reliability Engineering at Facebook
  11. Could it work better? Does it work well? Site Reliability

    Engineering Does it work? Site Reliability Engineering at Facebook
  12. Cloud

  13. On-premise Cloud Container (Edge?)

  14. On-premise SysAdmin Engineer On-premise 서버 10대 주세요 일주일 걸려요

  15. Salt Puppet Chef ⬥ ⬥ ⬥ Ansible ⬥ 자동화 도구

  16. Cloud Provider SRE Engineer Cloud 서버 10대 주세요 한시간만 기다리세요

    .
  17. Pet vs. Cattle https://unsplash.com/photos/sJgucUmcaKE https://unsplash.com/photos/sJgucUmcaKE

  18. 언제든 교체

  19. Programmable

  20. Cloud Development kit Pulumi ⬥ ⬥ ⬥ Terraform Infrastructure as

    Code
  21. Cloud Development kit Pulumi ⬥ ⬥ ⬥ Terraform Infrastructure as

    Code
  22. 프로그래밍 노하우를 인프라스트럭처에 적용

  23. 템플릿화 - 재현 가능 01 02 변경 히스토리

  24. 템플릿화 - 재현 가능 01 02 변경 히스토리

  25. Container 더 빨라진 변경 Source information

  26. Self Service

  27. On-premise SysAdmin Engineer On-premise 서버 10대 주세요 일주일 걸려요 Cloud

    Provider SRE Engineer Cloud 서버 10대 주세요 한시간만 기다리세요.
  28. 우리가 하는 일의 자동화

  29. 엔지니어와 SRE 모두가 편하지 않다 SRE팀을 확장하기 어렵다 01 02

    03 IaC 작업이 단순 반복적인 작업이 됨
  30. 주로 사용하는 언어는 YAML 입니다

  31. 엔지니어와 SRE 모두가 편하지 않다 SRE팀을 확장하기 어렵다 01 02

    03 IaC 작업이 단순 반복적인 작업이 됨
  32. 기본적으로 SRE팀은 엔지니어링에 초점을 맞춘다는 점이 가장 중요하다. “사이트 신뢰성

    엔지니어링" 책
  33. 끊임없이 엔지니어링을 추구하지 않으면 업무 부담이 증가하여 그 부담을 나누기

    위해 더 많은 인력이 필요하게 되고 결국에는 서비스의 크기에 따라 전통적인 운영 업무를 담당하는 인력이 기하급수적으로 늘어나게 된다. “사이트 신뢰성 엔지니어링" 책
  34. 엔지니어와 SRE 모두가 편하지 않다 SRE팀을 확장하기 어렵다 01 02

    03 IaC 작업이 단순 반복적인 작업이 됨
  35. SRE의 고객은 엔지니어

  36. Netflix - Operate What You Build Full Cycle Developer

  37. Self-Service With Internal Developer Platform

  38. What developer self-service shouldn't look like

  39. Gatekeeper Guardrail https://unsplash.com/photos/efyCSUNuFSI https://unsplash.com/photos/3HqT5ueqtIo

  40. 버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후

    문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04
  41. 버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후

    문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04
  42. 버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후

    문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04
  43. 버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후

    문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04
  44. Could it work better? Does it work well? Site Reliability

    Engineering Does it work? Site Reliability Engineering at Facebook
  45. Thank you