Slide 1

Slide 1 text

dipにおけるSRE変革の軌跡 ディップ株式会社 ソリューション開発本部 プラットフォーム開発統括部 プラットフォーム部 SRE・AI1課 大賀 光輝 (おおが ひかる) 1 Findy Job LT 2025/7/31(木)

Slide 2

Slide 2 text

Copyright © DIP Corporation, All rights reserved. 2 Agenda 1.はじめに(自己紹介) 2.今まで:“インフラエンジニア”でした 3.転換期:SREチームへ 4.今:ユーザ体験を創るために 5.未来:SRE+AIへ

Slide 3

Slide 3 text

Copyright © DIP Corporation, All rights reserved. 自己紹介 3

Slide 4

Slide 4 text

Copyright © DIP Corporation, All rights reserved. 自己紹介 大賀 光輝 (おおが ひかる) 入社:2024年4月 (新卒2年目) 担当プロダクト: 趣味:写真、ポータブルオーディオ、コーヒー ソリューション開発本部 プラットフォーム開発統括部 プラットフォーム部 SRE・AI1課 SRE+AIエンジニア 4

Slide 5

Slide 5 text

ビジョン “Labor force solution company” 人材サービスとDXサービスの提供を通して、労働市場における諸課題を解決し、 誰もが働く喜びと幸せを感じられる社会の実現を目指します。 × DX事業 Digital labor force solution バイトコミュニケーションアプリ『バイトルトーク』や、 機能を絞ったシンプルなSaaS型の『コボット』を通じて、 職場環境やコミュニケーション課題を解決しています。 人材サービス事業 Human work force solution ユーザーファーストな独自機能を搭載した、 求人情報・人材紹介サービスの提供を通じて、 ユーザーの就業課題を解決しています。 ディップ株式会社とは Copyright © DIP Corporation, All rights reserved. 5

Slide 6

Slide 6 text

Copyright © DIP Corporation, All rights reserved. 6 開発組織と技術スタック およそ150名 開発組織の規模 プロダクトのアーキテクチャ例 PHP / Laravel / Go / Next.js / React / Vue.js / Ruby on Rails / Swift / Kotlin / Python など 開発環境 AWS / GCP / Zabbix / New Relic / Hinemos / Oracle / PostgreSQL / Terraform / Ansible など インフラ環境

Slide 7

Slide 7 text

Copyright © DIP Corporation, All rights reserved. 7 今まで:“インフラエンジニア”でした

Slide 8

Slide 8 text

DX事業 人材サービス事業 Copyright © DIP Corporation, All rights reserved. 8 DXプロダクト開発統括部 システム統括部 2024年時点の開発組織 それぞれの事業部に別々の開発・インフラチーム

Slide 9

Slide 9 text

Copyright © DIP Corporation, All rights reserved. 9 当時のインフラチームの日常 依頼ベースの作業 開発「サーバ立ててください」 ↓ インフラ「はい、立てます」 インフラ指標での障害対応 アラート「CPU使用率90%超え!」 ↓ インフラ「再起動します!ポチ」 ⇨

Slide 10

Slide 10 text

課題①:そびえ立つ組織の壁 Copyright © DIP Corporation, All rights reserved. 開発 「なんか遅い...インフラの問題かも?」 インフラ 「サーバは正常です。アプリでは?」 課題 コミュニケーションの壁 お互いの領域のブラックボックス化 結果、ユーザ影響が長引く 10

Slide 11

Slide 11 text

課題②:知らぬうちに「同じこと」問題 Copyright © DIP Corporation, All rights reserved. 人材サービス事業インフラ 「よし、Aの取り組みをするぞ!」 DX事業インフラ 「よし、Bの取り組みをするぞ!」 課題 事業部ごとに組織が独立 ⇩ 知見が共有されず、同じ仕事を別々 に... 11

Slide 12

Slide 12 text

課題③:サーバは元気。でもユーザは... Copyright © DIP Corporation, All rights reserved. インフラ 「CPU OK!メモリOK!LAもいい感じ!」 ユーザ 「サイトが表示されない...」 「ボタンが押せない...」 課題 インフラ指標の監視だけではユーザ が本当に体感している問題に気づけ ない 知らないうちにユーザの信頼を失う リスク 12

Slide 13

Slide 13 text

課題④:“とりあえず”で乗り切る運用 Copyright © DIP Corporation, All rights reserved. 課題 明確な信頼性の目標が無い ベテランの肌感に頼った属人的な運用 13

Slide 14

Slide 14 text

Copyright © DIP Corporation, All rights reserved. 転換期:SREチームへ 14

Slide 15

Slide 15 text

Copyright © DIP Corporation, All rights reserved. 15 全社ソリューション体制への変革 AIを活用して就業・採用フローに沿ったソリューション提供

Slide 16

Slide 16 text

dip Tech Vision Copyright © DIP Corporation, All rights reserved. ユーザに最速で価値を届けるためのチームへ 16

Slide 17

Slide 17 text

Copyright © DIP Corporation, All rights reserved. 17 現在の開発組織 全プロダクトの開発組織が1本部に合併

Slide 18

Slide 18 text

プラットフォームチームへ Copyright © DIP Corporation, All rights reserved. 縦割りの組織から横断的なプラットフォームチームへ Platform Team Stream-Aligned Team Stream-Aligned Team Stream-Aligned Team 18

Slide 19

Slide 19 text

役割とマインドセットの変化 Copyright © DIP Corporation, All rights reserved. Before After 役割・分業 チームトポロジ 依頼ベース プラットフォーム提供 インフラ中心 ユーザ体験中心 サイロ化 コラボレーション 19

Slide 20

Slide 20 text

Copyright © DIP Corporation, All rights reserved. 20 今:ユーザ体験を創るために

Slide 21

Slide 21 text

Copyright © DIP Corporation, All rights reserved. 21 取り組み①: 「肌感」から「データ」へ SLI/SLOを導入中

Slide 22

Slide 22 text

Copyright © DIP Corporation, All rights reserved. 22 取り組み①: 「肌感」から「データ」へ SREのプラクティスに沿って推進 CUJを定義。 導入するSLI/SLOの優先順位づけを実施。重要なCUJからSLOの定義を策定中。 New Relicの各種機能(APM/Infra/Brouser/Mobile/Synthetic Monitoring)を用いて計測。 協働 開発チーム/企画チームを巻き込んでPJ化。 ユーザに近い観点での計測導入に向けて早い段階で共通認識の醸成/フロー化を図る。 ⇩ ユーザのご意見を汲んでからの対応ではなくプロダクトとして早期に対応できるように

Slide 23

Slide 23 text

取り組み②: 「ヒーロー」から「チーム」へ Copyright © DIP Corporation, All rights reserved. 障害対応フローを再構築 IC OL CL IC (Incident Commander) 障害対応の指揮 OL (Ops Lead) 復旧作業者 CL (Communications Lead) 社内調整者 23

Slide 24

Slide 24 text

取り組みによって期待している変化 Copyright © DIP Corporation, All rights reserved. Before After 気づけなかった障害 ユーザ体験の劣化を即時検知 長引く原因調査 ボトルネックの特定の迅速化 属人的な対応 チームで再現性のある対応 なんとなくの運用 エラーバジェットに基づいた意思決定 24

Slide 25

Slide 25 text

Copyright © DIP Corporation, All rights reserved. 25 その他の取り組み IaC標準化(Terraform) 2019年からTerraformを利用 ・密結合なコード ・低い可読性 ・属人的な運用 ⇩ Terragrunt/tflint/trivy/GHA をはじめ、ツール導入・リファクタ・ ルール整備により改善 コスト・セキュリティ向上 ・AWS Quick Sight + Amazon Qを 活用したコスト分析 ・AWS Security Hub/GuardDutyに よるセキュリティ向上 etc...

Slide 26

Slide 26 text

Copyright © DIP Corporation, All rights reserved. 26 未来:SRE+AIへ

Slide 27

Slide 27 text

SRE+AIでこんな未来を創りたい Copyright © DIP Corporation, All rights reserved. 信頼性の測定と管理 キャパシティプランニングとパフォーマンス チューニング コスト・セキュリティ Toilの排除 インシデント管理とポストモーテム ⇨ AI活用で自動化・自律的な改善へ 27

Slide 28

Slide 28 text

SRE+AIでこんな未来を創りたい Copyright © DIP Corporation, All rights reserved. タスクフォースを編成、取り組みを開始 28

Slide 29

Slide 29 text

感じている課題 Copyright © DIP Corporation, All rights reserved. 文化形成 SRE+AIは他社事例も少ない ⇩ 文化形成が鍵 Toilのさらなる削減 まだまだ残る手作業を どう削減していくか AI活用のためのデータ整備 AIに学習させるための 質の高いデータの集め方 etc... 29 文化形成

Slide 30

Slide 30 text

Copyright © DIP Corporation, All rights reserved. 30 まとめ

Slide 31

Slide 31 text

Copyright © DIP Corporation, All rights reserved. 31 まとめ 今まで(~2025/2) 縦割り組織で非効率/属人的なインフラ運用 転換期(2025/3~) dip Tech Visionをきっかけにチームトポロジへ変革 今(2025/7) 未来 SLI/SLOを武器にユーザ体験へアプローチ SRE+AIでさらにプロアクティブなSREへ

Slide 32

Slide 32 text

エンジニアリングの力でビジネスを成長させ、 「誰もが働く喜びと幸せを感じられる社会」を共に実現しましょう。 「挑戦し、変化し、リードする仲間」を募集中 📎採用情報 📎インタビュー記事 📎テックブログ 32

Slide 33

Slide 33 text

Copyright © DIP Corporation, All rights reserved. ご清聴ありがとうございました 33