Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
少人数SREチームが、長寿なシステムを構築・運用するための取り組み
Search
Konishi tatsuhiro
April 24, 2026
2
0
Share
少人数SREチームが、長寿なシステムを構築・運用するための取り組み
[コドモン x MIXI] 積み重なった課題とどう向き合うか — 長期運用のSREの実践 の発表資料です。
https://mixi.connpass.com/event/389250/
Konishi tatsuhiro
April 24, 2026
More Decks by Konishi tatsuhiro
See All by Konishi tatsuhiro
レガシー共有バッチ基盤への挑戦 - SREドリブンなリアーキテクチャリングの取り組み
tatsukoni
0
340
コンテナイメージ脆弱性検知の実践事例 ~ 基礎から応用まで ~
tatsukoni
0
44
ECSとEFSを組み合わせた Batchサーバー デプロイ方法の模索
tatsukoni
0
44
コンテナイメージを複数のチームで扱うための、ビルドフローの構築・運用
tatsukoni
0
160
休日・夜間のインスタンス自動停止をSREチームで運用してみた
tatsukoni
0
25
手付かずだったSecurity Hub運用を改善した話
tatsukoni
0
33
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
エンジニアに許された特別な時間の終わり
watany
106
240k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Un-Boring Meetings
codingconduct
0
270
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
160
Optimising Largest Contentful Paint
csswizardry
37
3.6k
My Coaching Mixtape
mlcsv
0
100
Building a Scalable Design System with Sketch
lauravandoore
463
34k
HDC tutorial
michielstock
2
630
Ethics towards AI in product and experience design
skipperchong
2
260
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Transcript
少人数SREチームが 長寿なシステムを構築・運用するための取り組み 2026年4月23日 株式会社コドモン 小西達大 [コドモン x MIXI] 積み重なった課題とどう向き合うか —
長期運用のSREの実践
2 経歴 前職でアプリケーションエンジニアとして従事後、 株式会社コドモンのSREチームにジョイン。 大阪在住。 自己紹介 小西 達大 こにし たつひろ
3 目次 1. はじめに:少人数SREチームが、長寿なシステムを構築・運用するための ポイント 2. 事例1:自治体ネットワーク向け閉域網システムの取り組み 3. 事例2:共有バッチ基盤の取り組み 4.
結び:本日のまとめと今後の展望
4 目次 1. はじめに:少人数SREチームが、長寿なシステムを構築・運用するための ポイント 2. 事例1:自治体ネットワーク向け閉域網システムの取り組み 3. 事例2:共有バッチ基盤の取り組み 4.
結び:本日のまとめと今後の展望
5 CONFIDENTIAL - © 2022 CoDMON Inc. 5 SREチームの体制と役割 •
メンバー3人 + マネージャー1人 の4人体制 • 一方、数多くの基盤システムを主担当として運用 ◦ ビジネス的に重要なシステム群 ❏ 自治体ネットワーク向け閉域網システム ❏ 共有バッチ基盤 ❏ 内部通信基盤 ❏ Push通知・メール送信基盤 ❏ terraform実行基盤 ❏ テスト環境構築のためのKubernetesクラスタ ❏ データベース運用基盤 ❏ … etc
6 CONFIDENTIAL - © 2022 CoDMON Inc. 6 重要システムを「少人数で」「長期間」運用するために 属人性をなくす
変更を容易にする 手離れを良くする
7 CONFIDENTIAL - © 2022 CoDMON Inc. 7 重要システムを「少人数で」「長期間」運用するために 属人性をなくす
・メンバーが入れ替わって もシステムを維持する必要 がある 変更を容易にする 手離れを良くする
8 CONFIDENTIAL - © 2022 CoDMON Inc. 8 重要システムを「少人数で」「長期間」運用するために 属人性をなくす
・メンバーが入れ替わって もシステムを維持する必要 がある 変更を容易にする ・長く運用するほど、ビジ ネス要求や外部環境の変化 / 依存ライブラリのEOL対 応など変更機会が増え続け る。 ・変更のたびにコストがか かる構成では持続しない 手離れを良くする
9 CONFIDENTIAL - © 2022 CoDMON Inc. 9 重要システムを「少人数で」「長期間」運用するために 属人性をなくす
・メンバーが入れ替わって もシステムを維持する必要 がある 変更を容易にする ・長く運用するほど、ビジ ネス要求や外部環境の変化 / 依存ライブラリのEOL対 応など変更機会が増え続け る。 ・変更のたびにコストがか かる構成では持続しない 手離れを良くする ・少人数チームのため、1シ ステムあたりの運用時間を 最小化しないと手が回らな い
10 CONFIDENTIAL - © 2022 CoDMON Inc. 10 重要システムを「少人数で」「長期間」運用するために 属人性をなくす
・メンバーが入れ替わって もシステムを維持する必要 がある 変更を容易にする ・長く運用するほど、ビジ ネス要求や外部環境の変化 / 依存ライブラリのEOL対 応など変更機会が増え続け る。 ・変更のたびにコストがか かる構成では持続しない 手離れを良くする ・少人数チームのため、1シ ステムあたりの運用時間を 最小化しないと手が回らな い → 事例1 → 事例2 → 事例2
11 目次 1. はじめに:少人数SREチームが、長寿なシステムを構築・運用するための ポイント 2. 事例1:自治体ネットワーク向け閉域網システムの取り組み 3. 事例2:共有バッチ基盤の取り組み 4.
結び:本日のまとめと今後の展望
12 CONFIDENTIAL - © 2022 CoDMON Inc. 12 閉域網システムの構成
13 CONFIDENTIAL - © 2022 CoDMON Inc. 13 閉域網システムの構成 多段にわたるインフラ構成に加え、関わる
関係者の多さ / 特有の要件 から、複雑なシ ステムとなっている
14 CONFIDENTIAL - © 2022 CoDMON Inc. 14 閉域網システムが抱えていた課題 •
属人化 ◦ 運用保守・ナレッジが特定のエンジニアに集中 ◦ システム全体が不透明で、限られた人しか運用できない状態 • 状況の緊迫化 ◦ 主担当エンジニアが離任予定 ◦ 各種サーバーのEOLも迫っており、改善が急務となっていた
15 CONFIDENTIAL - © 2022 CoDMON Inc. 15 閉域網システムが抱えていた課題 •
属人化 ◦ 運用保守・ナレッジが特定のエンジニアに集中 ◦ システム全体が不透明で、限られた人しか運用できない状態 • 状況の緊迫化 ◦ 主担当エンジニアが離任予定 ◦ 各種サーバーのEOLも迫っており、改善が急務となっていた ナレッジを広げ、 属人化を解消する取り組みを実施
16 CONFIDENTIAL - © 2022 CoDMON Inc. 16 取り組み:メンバー主体のナレッジ展開 各SREメンバーがそれぞれ
閉域網システムの構成情報 等を調査し、構成図として アウトプット 作成した構成図について、 各SREメンバーが自分の言 葉で説明。 主担当エンジニアがFBし、 認識の誤りがあれば訂正 不明点やシステム改善点を 主担当エンジニア含め話し 合う会を実施。 1 調査 & 構成図作成 2 説明会の実施 3 改善点の議論
17 CONFIDENTIAL - © 2022 CoDMON Inc. 17 ポイント:SREメンバー主体で実施 •
主担当エンジニアでなく、SREメンバー主体となって実施した理由 ◦ 自ら調べ、言語化することで、時間はかかるが主体的な学びになる ◦ 初歩的な点から理解し、端折らず説明するため、参加した他メンバーに も理解が広がる ◦ 複数人が各々インプット / アウトプットを行うことで、複数人の視点を 介し、構成の解像度が上がる
18 CONFIDENTIAL - © 2022 CoDMON Inc. 18 実施成果 •
複数のメンバーでの運用が可能になり、属人化状態を解消 • システムの解像度が上がったことで改善活動にも着手 ◦ 不要リソース削除による構成のスリム化 ◦ 監視最適化(メトリクス / ロギング / APMトレーシング)によるオブザーバビリ ティの向上 • 属人性解消プロセス(構成図作成 → 説明 → 課題発見)は、他PJ・システム にも横展開している
19 目次 1. はじめに:少人数SREチームが、長寿なシステムを構築・運用するための ポイント 2. 事例1:自治体ネットワーク向け閉域網システムの取り組み 3. 事例2:共有バッチ基盤の取り組み 4.
結び:本日のまとめと今後の展望
20 CONFIDENTIAL - © 2022 CoDMON Inc. 20 共有バッチ基盤の構成
21 CONFIDENTIAL - © 2022 CoDMON Inc. 21 共有バッチ基盤が抱えていた課題 •
認知負荷が高い ◦ この基盤のみEC2で稼働(他システムはECS) ◦ 開発者 / SRE 双方にとって、認知負荷が高い状態 • 変更が困難 ◦ ゴールデンイメージ化をしておらず、稼働中サーバーへの直接変更必要 ◦ 構成変更にリスクと心理的障壁あり • 手離れが悪い ◦ 上記2点によって、変更作業やトラブルシューティングがSREチームに依 存し、手離れが悪い状態
22 CONFIDENTIAL - © 2022 CoDMON Inc. 22 共有バッチ基盤が抱えていた課題 •
認知負荷が高い ◦ この基盤のみEC2で稼働(他システムはECS) ◦ 開発者 / SRE 双方にとって、認知負荷が高い状態 • 変更が困難 ◦ ゴールデンイメージ化をしておらず、稼働中サーバーへの直接変更必要 ◦ 構成変更にリスクと心理的障壁あり • 手離れが悪い ◦ 上記2点によって、変更作業やトラブルシューティングがSREチームに依 存し、手離れが悪い状態 根本課題:永続稼働前提のEC2で 動いていること
23 CONFIDENTIAL - © 2022 CoDMON Inc. 23 取り組み:ECSベースのコンテナ基盤へリプレイス Before
EC2ベース 永続稼働サーバー上で バッチ処理を実行 After ECSベース(コンテナ) 他システム群と同じ 標準化された実行基盤 • 他システムと同様の構成にすることで、開発者 / SRE 双方の認知負荷を軽減 • コンテナベースのアーキテクチャへ移行し、変更容易性を向上
24 CONFIDENTIAL - © 2022 CoDMON Inc. 24 実施成果 •
変更が容易に ◦ ミドルウェア変更・バージョンアップ対応の工数やリスクが減少 ◦ 開発チーム主体での処理改善活動も積極的に実施されている • 手離れの良さが向上 ◦ 開発チーム主体でミドルウェア導入を実施 ◦ SREへの依存が軽減し、開発チームの自律的な運用を実現
25 CONFIDENTIAL - © 2022 CoDMON Inc. 25 より詳しくは •
詳しいアーキテクチャ設計・リプレイスの進め方はこちら
26 目次 1. はじめに:少人数SREチームが、長寿なシステムを構築・運用するための ポイント 2. 事例1:自治体ネットワーク向け閉域網システムの取り組み 3. 事例2:共有バッチ基盤の取り組み 4.
結び:本日のまとめと今後の展望
27 CONFIDENTIAL - © 2022 CoDMON Inc. 27 まとめ 観点
事例 主な取り組み 属人化をなくす 事例1:閉域網システム メンバー主体のナレッジ展開プロセス 変更を容易にする 事例2:共有バッチ基盤 ECSベースへのリプレイス 手離れを良くする 事例2:共有バッチ基盤 認知負荷軽減 + 変更容易性向上により、 開発チームへの作業移譲を実現
28 CONFIDENTIAL - © 2022 CoDMON Inc. 28 今後の展望:AIの発展による実現手段の変化 観点
従来 今後 属人化をなくす 暗黙知をなくす AIが理解できる形での明文化・ドキュメント化 変更を容易にする 人間が変更容易な設計 AIが安全に変更できるガードレール整備 手離れを良くする 自動化 開発チームへの作業移譲 推進 AIへの作業移譲を推進 これらの観点は今後も重要だが、AIの発展により実現手段や優先度は変わって いくことが予想される
29 CONFIDENTIAL - © 2022 CoDMON Inc. 29 今後の展望:AIの発展による実現手段の変化 観点
従来 今後 属人化をなくす 暗黙知をなくす AIが理解できる形での明文化・ドキュメント化 変更を容易にする 人間が変更容易な設計 AIが安全に変更できるガードレール整備 手離れを良くする 自動化 開発チームへの作業移譲 推進 AIへの作業移譲を推進 これらの観点は今後も重要だが、AIの発展により実現手段は変わっていく 「AIに何ができるか」を継続的にウォッチし、 実現手段 / 優先度を更新していくことが重要
None