SREcon
22
• Темы:
• site reliability
• systems engineering
• complex distributed systems
• Компании:
• Google, Microsoft, Facebook, Linkedin, Ebay, Booking,
Net
fl
ix, Spotify, Uber, …
Slide 23
Slide 23 text
Доклады
23
• “Keys to SRE”, Ben Treynor, Site Reliability Tsar,
Google
• “Notes from Production Engineering”, Pedro
Canahuati, VP Production Engineering, Facebook
Slide 24
Slide 24 text
Facebook
24
Production Engineers at Facebook are hybrid
software/systems engineers who ensure that
Facebook's services run smoothly and have the
capacity for future growth. They are embedded in
every one of Facebook's product and infrastructure
teams, and are core participants in every signi
fi
cant
engineering effort underway in the company.
Slide 25
Slide 25 text
Хронология
25
2003
SRE
Google
2009
DevOps
2013
DevOps
Topologies
2016
SRE
Book
2012
TechRadar
2014
SREcon
Slide 26
Slide 26 text
SRE Book
26
Slide 27
Slide 27 text
SRE Book
27
• How Google runs production systems
• Принципы
• Практики
Slide 28
Slide 28 text
SRE Book
28
Slide 29
Slide 29 text
SRE Book
29
DevOps or SRE?
“One could view DevOps as a generalisation of
several core SRE principles to a wider range of
organisations, management structures, and
personnel.”
“One could equivalently view SRE as a speci
fi
c
implementation of DevOps with some idiosyncratic
extensions.”
Slide 30
Slide 30 text
Ben Treynor, VP of
Google Engineering
30
We’ve iterated to the current SRE de
fi
nition over the
last 15 years…
I expect we’ll continue to evolve it to make the role
even more attractive to developers while at the same
time making it more effective at running ef
fi
cient, high
availability, large scale systems.
Slide 31
Slide 31 text
Хронология
31
2003
SRE
Google
2009
DevOps
2013
DevOps
Topologies
2016
SRE
Book
2016
DevOps
Handbook
2012
TechRadar
2014
SREcon
Slide 32
Slide 32 text
DevOps Handbook
32
Slide 33
Slide 33 text
DevOps Handbook
33
• Методология, а не профессия
• С чего начать
• 3 пути:
• Практики непрерывной поставки (Dev -> Ops)
• Практики быстрой обратной связи (Ops -> Dev)
• Практики непрерывного обучения
Компании
45
• DevOps
• Amazon, Net
fl
ix, Target, Walmart, Facebook, Etsy,
Adobe
• SRE
• Google, Microsoft, Linkedin, Ebay, Booking,
Net
fl
ix, Spotify, Uber
Slide 46
Slide 46 text
Хронология
46
2003
SRE
Google
2009
DevOps
2013
DevOps
Topologies
2016
SRE
Book
2016
DevOps
Handbook
2017
DevQAOps
2012
TechRadar
2014
SREcon
2017
DBRE
Book
Slide 47
Slide 47 text
DBRE book
47
Slide 48
Slide 48 text
Reliability Engineering
48
• Site
• Database
• …
Slide 49
Slide 49 text
Хронология
49
2003
SRE
Google
2009
DevOps
2013
DevOps
Topologies
2016
SRE
Book
2016
DevOps
Handbook
2017
DevQAOps
2018
SRE vs
DevOps
2012
TechRadar
2014
SREcon
2017
DBRE
Book
Slide 50
Slide 50 text
SREcon
50
• Security and SRE
• Building Successful SRE in Large Enterprises
• Security as a Service
• The Evolution of Site Reliability Engineering
Slide 51
Slide 51 text
Stack Over
fl
ow
51
Slide 52
Slide 52 text
StackOver
fl
ow
52
DevOps and machine learning are important trends in
the software industry today. Languages and
frameworks associated with these kinds of works are
on the rise, and developers working in these areas
command the highest salaries.
SRE - ?
Slide 53
Slide 53 text
Тренды
53
Slide 54
Slide 54 text
SRE vs DevOps
54
Slide 55
Slide 55 text
SRE vs DevOps
55
Slide 56
Slide 56 text
SRE vs DevOps
56
Slide 57
Slide 57 text
SRE vs DevOps
57
Slide 58
Slide 58 text
Википедия
58
• Site Reliability Engineering
• DevOps vs SRE
• SRE and DevOps share the same
foundational principles. SRE is viewed by
many (as cited in the Google SRE book) as a
"speci
fi
c implementation of DevOps with
some idiosyncratic extensions."
Slide 59
Slide 59 text
Википедия
59
Slide 60
Slide 60 text
Новые книги
60
Slide 61
Slide 61 text
Seeking SRE
61
• How to Apply SRE Principles without Dedicated SRE Teams
• The Intersection of Reliability and Privacy
• The Art and Science of the SLO (Service Level Objectives)
• Immutable Infrastructure and SRE
• Scriptable Load Balancers
• The Service Mesh: Wrangler of Your Microservices?
• Psychological Safety in SRE
Slide 62
Slide 62 text
How to Apply SRE Principles
without Dedicated SRE Teams
62
• SoundCloud (~100 engineers)
• Hired a couple of former Google SREs and tried
“SRE by the book”
• “We could not just copy Google SRE verbatim, we
had to adjust the approach to our circumstances.”
• SRE Team -> Embedded SRE -> True DevOps ->
Platforms Team -> Production Engineering
Slide 63
Slide 63 text
The Site Reliability
Workbook
63
• Practical Ways to Implement SRE
Slide 64
Slide 64 text
How SRE relates to
DevOps
64
“If you think of DevOps as a philosophy and an approach to working”
“SRE implements some of the philosophy that DevOps describes”
“SRE Engineer is closer to a concrete de
fi
nition of a job or role than,
say, “DevOps engineer.”
“SRE has more concrete suggestions on how to change your work
practices earlier on in that journey, albeit requiring speci
fi
c
adaptation. DevOps, having a wider focus, is somewhat more dif
fi
cult
to reason about and translate into concrete steps, but precisely because
of that wider focus, is likely to meet with weaker initial resistance.”
Slide 65
Slide 65 text
Что Google не
договаривает
65
Кроме SRE еще есть:
• Software Engineers (SWE)
• Software Engineers in Test (SET)
• Release Engineers
• …
Slide 66
Slide 66 text
Что Google не
договаривает
66
Кроме SRE еще есть:
• Software Engineers (SWE)
• Software Engineers in Test (SET)
• Release Engineers
• …
DevOps
Slide 67
Slide 67 text
А что у нас?
Slide 68
Slide 68 text
DevOps как профессия
68
• Системный/дежурный администратор
• Выделенный OPS в команде разработки
• Инфраструктурный/платформенный инженер
• Релиз инженер
• SRE инженер
Крупные компании
70
Яндекс/Mail.ru:
• Инженер доступности сервисов (SRE)
• Дежурный администратор (SRE)
• DevOps инженер
Slide 71
Slide 71 text
DevOps как методология
71
• CIO/Директор по ИТ
• CTO/Технический директор
Slide 72
Slide 72 text
Книги
72
• Переводы книг DevOps Handbook и SRE
выходят летом
• Есть переводы книг Проект Феникс и
Философия DevOps
Slide 73
Slide 73 text
Конференции
73
• DevOps: РИТ, Highload, DevOops, DevOpsPro,
DevOpsDays
• Как SRE следит за стабильностью и скоростью
HeadHunter (Антон Иванов)
• Отдельный отдел (разработчики)
• Про приложения и архитектуру
• Про мониторинг и дежурства
Slide 74
Slide 74 text
Наш опыт
74
• Есть DevOps, но не называют это DevOps
• Есть SRE, но не называют это SRE
• Есть DevOps инженеры
• Нет DevOps/SRE
Slide 75
Slide 75 text
Итого
75
• DevOps и SRE активно развиваются
• SRE инженер = DevOps инженер
• Только SRE недостаточно
• DevOps шире, поэтому сложнее для внедрения
• DevOps популярнее и скорее всего про вас
Slide 76
Slide 76 text
Итого
76
• DevOps и SRE активно развиваются
• SRE инженер = DevOps инженер
• Только SRE недостаточно
• DevOps шире, поэтому сложнее для внедрения
• DevOps популярнее и скорее всего про вас
Slide 77
Slide 77 text
Что не следует делать
77
• Скопипастить, не подумав
• Переименовываться в SRE
• Создавать отдельную SRE команду
Slide 78
Slide 78 text
Что следует делать
78
• Понять какую проблему вы решаете
• Понять какие проблемы решает DevOps и SRE
• Подумать как это поможет вам
• Обсудить/продать внутри компании