Slide 1

Slide 1 text

당근마켓 SRE Outsider 클라우드 시대에 맞는 사이트 신뢰성 엔지니어

Slide 2

Slide 2 text

Google에서 쓴 사이트 신뢰성 엔지니어 링

Slide 3

Slide 3 text

Infra Engineer Cloud Engineer DevOps Engineer ⬥ ⬥ ⬥ Site Reliability Engineer ⬥ ….

Slide 4

Slide 4 text

Infrastructure

Slide 5

Slide 5 text

Engineer Site Reliability Engineer

Slide 6

Slide 6 text

DevOps

Slide 7

Slide 7 text

No content

Slide 8

Slide 8 text

Google Cloud Tech “What's the Difference Between DevOps and SRE?” class SRE implements DevOps

Slide 9

Slide 9 text

Does it work well? Site Reliability Does it work? Site Reliability Engineering at Facebook Could it work better? Engineering

Slide 10

Slide 10 text

Could it work better? Does it work well? Site Reliability Engineering Does it work? Site Reliability Engineering at Facebook

Slide 11

Slide 11 text

Could it work better? Does it work well? Site Reliability Engineering Does it work? Site Reliability Engineering at Facebook

Slide 12

Slide 12 text

Cloud

Slide 13

Slide 13 text

On-premise Cloud Container (Edge?)

Slide 14

Slide 14 text

On-premise SysAdmin Engineer On-premise 서버 10대 주세요 일주일 걸려요

Slide 15

Slide 15 text

Salt Puppet Chef ⬥ ⬥ ⬥ Ansible ⬥ 자동화 도구

Slide 16

Slide 16 text

Cloud Provider SRE Engineer Cloud 서버 10대 주세요 한시간만 기다리세요 .

Slide 17

Slide 17 text

Pet vs. Cattle https://unsplash.com/photos/sJgucUmcaKE https://unsplash.com/photos/sJgucUmcaKE

Slide 18

Slide 18 text

언제든 교체

Slide 19

Slide 19 text

Programmable

Slide 20

Slide 20 text

Cloud Development kit Pulumi ⬥ ⬥ ⬥ Terraform Infrastructure as Code

Slide 21

Slide 21 text

Cloud Development kit Pulumi ⬥ ⬥ ⬥ Terraform Infrastructure as Code

Slide 22

Slide 22 text

프로그래밍 노하우를 인프라스트럭처에 적용

Slide 23

Slide 23 text

템플릿화 - 재현 가능 01 02 변경 히스토리

Slide 24

Slide 24 text

템플릿화 - 재현 가능 01 02 변경 히스토리

Slide 25

Slide 25 text

Container 더 빨라진 변경 Source information

Slide 26

Slide 26 text

Self Service

Slide 27

Slide 27 text

On-premise SysAdmin Engineer On-premise 서버 10대 주세요 일주일 걸려요 Cloud Provider SRE Engineer Cloud 서버 10대 주세요 한시간만 기다리세요.

Slide 28

Slide 28 text

우리가 하는 일의 자동화

Slide 29

Slide 29 text

엔지니어와 SRE 모두가 편하지 않다 SRE팀을 확장하기 어렵다 01 02 03 IaC 작업이 단순 반복적인 작업이 됨

Slide 30

Slide 30 text

주로 사용하는 언어는 YAML 입니다

Slide 31

Slide 31 text

엔지니어와 SRE 모두가 편하지 않다 SRE팀을 확장하기 어렵다 01 02 03 IaC 작업이 단순 반복적인 작업이 됨

Slide 32

Slide 32 text

기본적으로 SRE팀은 엔지니어링에 초점을 맞춘다는 점이 가장 중요하다. “사이트 신뢰성 엔지니어링" 책

Slide 33

Slide 33 text

끊임없이 엔지니어링을 추구하지 않으면 업무 부담이 증가하여 그 부담을 나누기 위해 더 많은 인력이 필요하게 되고 결국에는 서비스의 크기에 따라 전통적인 운영 업무를 담당하는 인력이 기하급수적으로 늘어나게 된다. “사이트 신뢰성 엔지니어링" 책

Slide 34

Slide 34 text

엔지니어와 SRE 모두가 편하지 않다 SRE팀을 확장하기 어렵다 01 02 03 IaC 작업이 단순 반복적인 작업이 됨

Slide 35

Slide 35 text

SRE의 고객은 엔지니어

Slide 36

Slide 36 text

Netflix - Operate What You Build Full Cycle Developer

Slide 37

Slide 37 text

Self-Service With Internal Developer Platform

Slide 38

Slide 38 text

What developer self-service shouldn't look like

Slide 39

Slide 39 text

Gatekeeper Guardrail https://unsplash.com/photos/efyCSUNuFSI https://unsplash.com/photos/3HqT5ueqtIo

Slide 40

Slide 40 text

버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후 문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04

Slide 41

Slide 41 text

버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후 문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04

Slide 42

Slide 42 text

버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후 문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04

Slide 43

Slide 43 text

버튼 클릭으로 권한 획득 서버 생성을 누르면 서버 획득 배포후 문제 생기면 바로 알람 01 02 03 걱정없이 배포 버튼 클릭만으로 배포 04

Slide 44

Slide 44 text

Could it work better? Does it work well? Site Reliability Engineering Does it work? Site Reliability Engineering at Facebook

Slide 45

Slide 45 text

Thank you