Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ゼロから始めるSREの事業貢献 - 生成AI時代のSRE成長戦略と実践 / Starting ...

ゼロから始めるSREの事業貢献 - 生成AI時代のSRE成長戦略と実践 / Starting SRE from Day One

Developers Summit 2025 Summer登壇資料

https://event.shoeisha.jp/devsumi/20250717/session/5935

Avatar for Shinichi Nakagawa

Shinichi Nakagawa

July 18, 2025
Tweet

More Decks by Shinichi Nakagawa

Other Decks in Technology

Transcript

  1. © LayerX Inc. 3 LayerX(2025年1⽉⼊社) • AI‧LLM事業部 プロダクト部 開発グループ SRE(1⼈⽬)

    • SREとして以下ミッションを推進 ◦ SRE(サイト信頼性エンジニアリング)の戦略&実装 ◦ Ai Workforceのお客様導⼊の推進 • ブログ執筆‧登壇‧イベント司会(8/1 Bet AI Day)などもやる 中川 伸⼀(NAKAGAWA,Shinichi) 経歴‧趣味 • 今までの経歴&できること: ◦ 前職アクセンチュアでクラウドインフラ‧SRE組織のManagerとしてデリバリーに従事 ◦ その前は複数社ベンチャー(News, Sports, etc…)のIC/Engineering Manager/CTO ◦ 基本的にはフルスタックエンジニア、純粋なSRE歴は5年未満(キャリア全体で25年) • 好き&趣味: クラウド全般、Python、野球データ分析、信⻑の野望、マイホーム、グルメ ⾃⼰紹介 @shinyorke
  2. 4 © LayerX Inc. 「すべての経済活動を、デジタル化する。」をミッションに、AI SaaSとAI DXの事業を展開 会社の紹介 バクラク事業 企業活動のインフラとなる業務を

    効率化するクラウドサービス Fintech事業 ソフトウェアを駆使したアセットマネジ メント‧証券事業を合弁会社にて展開 AI‧LLM事業 社内のナレッジやノウハウをデータ ベース化するAIプラットフォーム AI SaaSドメイン AI DXドメイン
  3. 5 © LayerX Inc. 「すべての経済活動を、デジタル化する。」をミッションに、AI SaaSとAI DXの事業を展開 会社の紹介 バクラク事業 企業活動のインフラとなる業務を

    効率化するクラウドサービス Fintech事業 ソフトウェアを駆使したアセットマネジ メント‧証券事業を合弁会社にて展開 AI‧LLM事業 社内のナレッジやノウハウをデータ ベース化するAIプラットフォーム AI SaaSドメイン AI DXドメイン 本⽇の舞台
  4. © LayerX Inc. 6 プロダクト紹介 プロダクト 使えば使うほど成⻑する⽣成AIプラットフォーム 技術スタック Azure, OpenAI中⼼のCloud

    Nativeな構成 ⽣成AIプロダクト「Ai Workforce」をEnterprise向けに提供 ※スライド引⽤: LayerX AI‧LLM Division Deck https://speakerdeck.com/layerx/aillm-division-deck
  5. © LayerX Inc. 7 【前編】⽣成AI時代のSREに必要なこと • ⽣成AI時代ならではのSREの悩み(≒やること‧考えること多すぎ問題) • Cloud Nativeな環境でのSREの実践そしてCloud

    Strategy • Technical Project Management重要 Ai WorkforceのSRE組織⽴ち上げの中でやった事業貢献の紹介 【後編】1⼈⽬SREの事業貢献 • 1⼈⽬SREとして何をして事業貢献するか?の実話 • ⼊社⽇(Day1)から現在までやったことを紹介 • 環境に慣れて事業貢献するまでのストーリー 本⽇のお話
  6. © LayerX Inc. 9 Cloud/⽣成AIな考え⽅‧戦略を Biz/Dev両⽅いい感じに共有 TechなProject Management⼤事 難易度⾼いPMO的な役割が⼤事 Cloud

    Native Cloud Native思想なシステム設計が ⽣成AI時代ではより重要に Cloud Strategy Management 【結論】⽣成AI時代のSREに必要なこと3つ(異論は認める) ⽣成AI時代のSREに必要なこと ※画像引⽤: いらすとや
  7. © LayerX Inc. 10 ⽣成AI時代のSREに必要なこと オブザーバビリティ‧トイル対処‧インシデント対応(含むポストモーテム)は勿論重要。 ⽣成AI時代のSREを考える - 今まで通り変わらないこと ミッション

    解説 必要なスキル(例) オブザーバビリティ ‧システム状態の可視化および異常検知の効率化 ‧メトリクス‧ログ‧トレースの統合的収集‧分析 ‧SLO/SLIの設計と運⽤、⾒える化 ‧APM導⼊‧運⽤ ‧ログ分析基盤導⼊‧運⽤ ‧SLO/SLI設計&適⽤ トイルへの対処 ‧繰り返し作業‧⼿作業等の「退屈な作業」を削減 ‧IaC(Infrastructure as Code)導⼊、CI/CD⾃動化 ‧⽣成AIに作業を委譲 ‧IaC(Terraform等) ‧CI/CD(GitHub Actions等) ‧shell/Pythonで⼒技 インシデント対応 ‧障害発⽣時の即時対応、透明感ある振り返り ‧ポストモーテム⽂化の醸成と運⽤でナレッジ蓄積 ‧SLOとの連携(エラーバジェット導⼊等) ‧オンコール対応‧運⽤設計 ‧ポストモーテムによる⾔語化 ‧ステークホルダーへの説明
  8. © LayerX Inc. 11 ⽣成AI時代のSREに必要なこと システム設計‧運⽤のコアスキルたる「インフラ信頼性」「コスト‧運⽤効率」は更に重要に。 ⽣成AI時代のSREを考える - 今まで通り変わらないこと(続き) ミッション

    解説 必要なスキル(例) インフラ信頼性向上 ‧⾼可⽤性‧⾼スケーラブルなインフラ設計‧実装 ‧ネットワーク‧セキュリティ要件の確実な実装 ‧Disaster Recovery(DR)等の要件定義‧実装 ‧複数のPublic Cloud経験 ‧ネットワーク‧セキュリティ ‧SWE領域の理解と経験 コスト‧運⽤最適化 ‧無駄なインフラ‧クラウドコストの削減 ‧Auto Scaling導⼊等でSLA維持のまま運⽤最適化 ‧コストの可視化と分析、アラート通知 ‧クラウドのコストモデル理解 ‧Auto Scalingの理解と導⼊ ‧FinOps‧コスト分析
  9. © LayerX Inc. 12 ⽣成AI時代のSREに必要なこと ⽣成AIならではのアーキの難しさ、SWEおよびBizを含めたステークホルダー対する役割が増えた感。 ⽣成AI時代のSREを考える - 新たに加わったミッション ミッション

    解説 必要なスキル(例) ⽣成AI導⼊前提の アーキテクチャ設計 ‧⽣成AIサービス利⽤超過を防ぐアーキテクチャ ‧クォータ制限‧レートリミットを守る ‧Application実装‧設計との連携 ‧API Gateway等で流量制御 ‧キャッシュ設計‧実装 ‧Pub/Sub等の⾮同期実装 新たなAIサービスと LLMモデルへの対処 ‧新たなAIサービス導⼊による要件変更への対応 ‧LLM‧⽣成AIモデルの⼊れ替え‧デプロイ戦略 ‧Application実装‧設計との連携 ‧IaCおよびCI/CDの最適化 ‧モデルレジストリ運⽤ ‧Application設計‧実装 ステークホルダー連携 (プロマネと説明) ‧デリバリー全般(導⼊‧運⽤)での説明‧可視化 ‧AIの信頼性‧制約‧トレードオフを適切に説明 ‧すべてのステークホルダーに橋渡しする可能性 ‧ステークホルダーへの説明 ‧特にユーザー‧お客様への  対処(Client Facing)
  10. 13 © LayerX Inc. SRE 信頼性の可視化と維持 オブザーバビリティ SLO/SLI設計と監視 ⽣成AI時代のSREに必要なこと インシデント対応‧ポストモーテム

    運⽤効率と安定性の向上 トイルへの対処 CI/CD‧IaC導⼊‧運⽤ コスト‧運⽤の最適化 ⽣成AI時代のSREに必要なこと(ChatGPTさんのまとめ)
  11. 14 © LayerX Inc. SRE インフラとアーキテクチャの強靭化 ⾼可⽤性‧スケーラブルな設計 ⽣成AIならではの制約条件考慮 ⽣成AI時代のSREに必要なこと SWE領域(Application)への理解

    ステークホルダー連携‧説明 デリバリー(構築‧運⽤)への貢献 技術要件の説明と合意形成 SWE/Biz/お客様を渡り歩く対話⼒ (圧倒的なClient Facing⼒) ⽣成AI時代のSREに必要なこと(まだあります...)
  12. SRE 信頼性の可視化と維持 オブザーバビリティ SLO/SLI設計と監視 インシデント対応‧ポストモーテム 運⽤効率と安定性の向上 トイルへの対処 CI/CD‧IaC導⼊‧運⽤ コスト‧運⽤の最適化 インフラとアーキテクチャの強靭化

    ⾼可⽤性‧スケーラブルな設計 ⽣成AIならではの制約条件考慮 SWE領域(Application)への理解 ステークホルダー連携‧説明 デリバリー(構築‧運⽤)への貢献 技術要件の説明と合意形成 SWE/Biz/お客様を渡り歩く対話⼒ (圧倒的なClient Facing⼒) ※全体像(ChatGPTさんまとめ)
  13. © LayerX Inc. 17 Cloud/⽣成AIな考え⽅‧戦略を Biz/Dev両⽅いい感じに共有 TechなProject Management⼤事 難易度⾼いPMO的な役割が⼤事 Cloud

    Native Cloud Native思想なシステム設計が ⽣成AI時代ではより重要に Cloud Strategy Management 多すぎるSREミッションを乗りこなす三本の⽮がこちら(再掲) ⽣成AI時代のSREに必要なこと ※画像引⽤: いらすとや
  14. © LayerX Inc. 18 ⽣成AI時代のSREに必要なこと Cloud Nativeは従来通りっぽさあるが、Cloud StragetegyとManagementは重要性が増した説。 ⽣成AI時代のSREに必要なこと 必要なこと

    解説 どのミッションに⽣きるか ※上位3つ Cloud Native プロダクト‧サービスをクラウド環境で最⼤限 に活⽤できるように設計‧開発‧運⽤するアプ ローチや設計思想のこと。 ‧⽣成AI導⼊前提のアーキテクチャ設計 ‧新たなAIサービスとLLMモデルへの対処 ‧インフラ信頼性向上 Cloud Strategy クラウドの導⼊‧利⽤において重要なポイント を体系化した考え⽅。AWSやAzure、Google Cloudといった特定のプロバイダーに依存しな い、戦略的な視点を提供する思想。 ‧新たなAIサービスとLLMモデルへの対処 ‧ステークホルダー連携 ‧コスト‧運⽤最適化 Management ※Technical Project Management 正確には「Technical Project Management」を指す。技 術的‧ビジネス的リスクをハンドリングしながら安定し たデリバリーを⾏うマネジメントのこと。 ※PMOにエンジニアリング要素を⾜した感じ。 ‧ステークホルダー連携 ‧インシデント対応 ‧オブザーバビリティ
  15. © LayerX Inc. 21 理解を継続しながらチームに⼊る。 主体的に出来るものは巻取り。 SREチーム内外のメンバーと共に、 「SREチーム」を醸成していく。 Day1「チームを知る」 チームとプロダクトの理解を優先。

    ⾃分はまだ新⼈という意識をする。 Day10「チームに⼊る」 Day20「チームを作る」 【実話】Day1からDay20までの過ごし⽅ - 実際にやったこと 1⼈⽬SREの事業貢献 ※画像引⽤: いらすとや
  16. © LayerX Inc. 22 1⼈⽬SREの事業貢献 「⾃分はまだ何も知らない新⼈」の気持ちでオンボーディング、会話、プロダクトとの対話で理解。 Day1「チームを知る」 - ひたすら理解を頑張る やったこと

    概要 スタンスもしくは実際の⾏動 オンボーディング いわゆる「⼊社‧⼊部⼿続き」を愚直にやる ‧会社全体の⼊社オンボーディング ‧事業部のオンボーディング ‧必要な情報の在処を知る ‧⽂化‧空気を感じる ‧ひたすら資料読み 事業部の皆さんと 仲良くなる Biz/Dev別け隔てなく会話して事業部と仲良く ‧事業部全体のイベントで議論に参加 ‧懇親会で⾊々な⽅に⾃⼰紹介&顔を売る ‧仮説(適当)でいいから話す ‧積極的に議論に参加する ‧とにかく⾃分の顔を売る プロダクトの理解 開発環境でプロダクトに触って⾊々知る ‧開発環境でとりあえず⾊々触る(管理機能除く) ‧ローカルで環境構築して壊してみる ‧⼿を動かして環境作る ‧フィードバック‧⼿順修正 ‧コードリーディング
  17. © LayerX Inc. 24 1⼈⽬SREの事業貢献 新⼈気分はもう終わり。理解しながらやれることをプロフェッショナルとして動きチームを知る。 Day10「チームを知る」 - ガンガンいこうぜ(⼿を動かす) やったこと

    概要 スタンスもしくは実際の⾏動 SRE‧インフラの キャッチアップ 本業のSRE‧インフラ仕事をするため巻き取る ‧保守‧運⽤のタスク確認&⼿順確認 ‧⾃分でやってみる ‧⼀旦領域は決めない(敢えて) ‧⼿順が無いものは⾔語化 ‧まずはやってみるの精神 出来ること‧⾒つけた ことを勝⼿にやる プロジェクトワークおよび落ちそうな仕事をやる ‧プロジェクトワークで出来そうなところから着⼿ ‧⾒つけた‧落ちた仕事を拾う ‧⾛りながら考える‧やる ‧ゼロベースで会話‧意⾒ ‧⾔ったことをやり切る SREギルドを作る コーポレートITおよび他事業部のSREな⼈と繋がる ‧事業部1⼈SREで相談できる⼈居ないリスクの回避 ‧情報共有‧相談できる仲間づくり ‧まず⾃⼰紹介 ‧⼀緒にランチ、顔を売る ‧ギルド感を作る
  18. © LayerX Inc. 27 1⼈⽬SREの事業貢献 ⼊社から2ヶ⽉(Day30)でSREギルドと前職メンバー合同で「LayerX SRE & Cloud Native

    Night!」開催 SREギルドを作る(その後) - 社外を巻き込んでイベント開催 ※画像引⽤: xから検索して拾ったもの&⾃分で撮影 少⼈数でしたがDeep Diveな議論&バズったネタもあり楽しかった 私
  19. © LayerX Inc. 28 1⼈⽬SREの事業貢献 新⼈気分はもう終わり。理解しながらやれることをプロフェッショナルとして動きチームを知る。 Day20「チームを作る」 - 1⼈の時点からチーム化の流れを作る やったこと

    概要 スタンスもしくは実際の⾏動 SRE‧インフラ仕事の チーム化 SRE‧インフラ仕事の「属⼈化」を解消する ‧保守‧運⽤のタスクをWorkflow化 ‧「中川さんに依頼」から「SREに依頼」にシフト ‧スケールする仕組みへの移⾏ ‧SREチームの浸透 ‧依頼フローを整理‧実装 ⼩さく重要施策をやる 「オブザーバビリティの検討」などを⼩さく開始 ‧Biz/Dev両⽅から⾒て必要な仕事の議論‧設計 ‧SREの独りよがりにならない着地を⽬指す ‧Design Doc/ADRの執筆 ‧⾔語化からの壁打ち ‧Biz/Dev双⽅にちゃんと伝える 採⽤!採⽤!! まだ⾒ぬ仲間に会うための活動それは「採⽤」 ‧⾯談‧⾯接などの選考ミッションに着⼿ ‧ブログ執筆、イベント開催、登壇etc… ‧夢と現実をちゃんと語る ‧定期的な⾔語化‧発信 ‧社外の⼈も巻き込む
  20. © LayerX Inc. 31 1⼈⽬SREの事業貢献 なんやかんやで「信頼」と「⼩さくやる」こと、そして「⾊んな壁を超える」ような事が効果あった。 Day1-Day20までに意識したこと‧やったこと 意識したこと 解説 やったこと

    信頼されるSREの起 点としての私 Biz/Dev両⽅にSREの必要性を私⾃⾝の「チー ムへの貢献」で感じるように振る舞った。実績 や知識よりアウトカム指向重視で。 ‧事業部の皆さんと仲良くなる ‧SRE‧インフラ仕事のチーム化 ‧出来ること‧⾒つけたことを勝⼿にやる Small Start (⼩さくやる) 「⼩さなことからコツコツと」やれることから やる。オブザーバビリティ、エラーバジェット みたいな⼤物じゃなくて⼩さいことから。 ‧出来ること‧⾒つけたことを勝⼿にやる ‧⼩さく重要施策をやる ⾊んな壁を超える (愛をもって) 「SWEとSRE」「BizとDev」「違う事業部」など、壁 になりがちな事を「愛(AI)をもって」超えるように振 る舞った。お互いの⽴場で⾔語化する、コミュニケー ションをいい感じにするなど。 ‧SREギルドを作る ‧事業部の皆さんと仲良くなる
  21. © LayerX Inc. 32 1⼈⽬SREの事業貢献 ⼈それぞれなので何ともですが「専⾨家」「ビックバン」「引きこもり」はしないほうが懸命かと。 「アンチパターン」と判断して避けたこと 意識したこと 解説 備考

    専⾨的なSREな⼈と しての振る舞い 「SREの専⾨家としての私」じゃなくて 「shinyorkeさんという1⼈の単位」を重視。 専⾨的な振る舞いより成果を。アウトカムを。 そもそも私が専⾨職なSREのキャリアとい うより、「フルスタックエンジニアがSRE とコンサルやってます」というのが理由。 ビッグバン (⼤きな施策) 成果出るまで時間かかるので避けるべき。幸い にも⼊社後のミッションが中⻑期で結果だす or 眼の前の改善が主だったので回避。 SWE時代の苦い経験で⼊社早々に⼤きい ミッションを持つのはなんとなく避けてい た(持つけど⼩さく出来る⽅がいい)。 個別最適化 ⾃分の陣地(SRE‧インフラエンジニア)に蛸壺のよう にこもる個別最適化を回避。1⼈のままでは遠くに⾏け ない(成果が出ない)のもあるが、妙な分断が⽣まれる と良くないと思ったため。 「SWEがやるかSREがやるか」みたいな事 を回避する意味でも変な個別最適化は避け るようにした。
  22. © LayerX Inc. 34 SRE組織と⾃分のこれから ⽣成AIを「扱う」のみならず「バディとして伴⾛する」を本格的に実装したい。 【現在】Day20から今現在、注⼒していること やったこと 概要 スタンスもしくは実際の⾏動

    ⽣成AIを良きバディに ⽣成AIをバディにしてSREの価値を⾼める ‧SREタスクやアラート検知の⽣成AI導⼊ ‧トイルの撲滅、ドキュメンテーションのアシスト ‧ひたすら試す「Bet AI」 ‧⼈の作業を減らす ‧テーマを持ってやる デリバリーの安定化 環境構築‧提供のデリバリーメソッド化 ‧お客様業務‧形態に合わせたデリバリーの形化 ‧IaC、DevOpsは勿論Client Facing含め世界を創る ‧再現性をもたせるのが第⼀ ‧デリバリーの⾔語化 ‧積んだ経験を活かす 採⽤!採⽤!! (引き続き) 仲間探しはまだまだ続く...⽣成AIと共に ‧兼務含めて⼈は増えたがまだまだ ‧⽣成AI活⽤&リアルイベント込みでいい感じに ‧採⽤ワークも⽣成AI ‧SREギルドとのコラボ増やす ‧社外の⼈も巻き込む
  23. © LayerX Inc. 35 SRE組織と⾃分のこれから SREの⾃動運転をするため、まず⾃分がやれることから⽣成AIに全ベット(Bet AI)することに。 ⽣成AIを良きバディに - まず⾃分がAIを信じて賭ける。

    個⼈ブログ、会社ブログ共にAI執筆。 個⼈開発でAI活⽤のヒントを探る⚾ ※画像引⽤: https://shinyorke.hatenablog.com/ & 個⼈開発の実験台より ※仕事でもしています(諸事情により⾮公開)
  24. © LayerX Inc. 36 SRE組織と⾃分のこれから SREは⼤好きですが...⽣涯やりたいというより、「SREから次のエンジニアなキャリア」を⽬指す。 shinyorkeの野望 - ⾃分のキャリア‧アスピレーション やりたいこと

    概要 スタンスもしくは実際の⾏動 ⽣成AIを良きバディに 結果を残す 仕事も趣味も⽣成AIに賭けていく(Bet AI) ‧業務としてのエンジニアリング‧SREの⾃動運転 ‧趣味開発‧創作活動で⼀発なにかやっていき ‧SREの⾃動運転を⽬指す ‧執筆系全般をAIに ‧趣味開発を⽣成AIでいい感じに SRE後のいい感じな キャリア形成 SRE組織が成熟した後の⾃分のキャリア‧役割創り ‧いい年齢(今年で46)なので50⽬指して、ね ‧SREからEMとかでもいいがもっと何かある? ‧⾃分をSREで縛らない ‧おじさんを⾔い訳にしない ‧個⼈‧副業で挑戦しまくる ⽣成AIと共に「⾃ら機会を創り出し、機会によって⾃らを変える」動きを続けたい(願望)
  25. © LayerX Inc. 38 ⽣成AI時代のSREに必要なこと(事業貢献に必要なスキルと戦略、マネジメント) • Cloud Native • Cloud

    Strategy • Technical Project Management まとめ - ゼロからはじめるSREの事業貢献とは 1⼈⽬SREの事業貢献(SREとして振る舞うべき⾏動とスタンス) • 信頼されるSREの起点としての私 • Small Start • ⾊んな壁を超える 結び
  26. © LayerX Inc. 39 「アンラーニング」 - たくさん学んでたくさん⼿を動かしてたくさんAIを使おう • 公式ドキュメント、本、⼈のブログ。なんでもいいからたくさん読もう。 •

    ⼿を動かす。めっちゃ動かす。CursorでもClaude codeでも頼っていいから何でも。 • たくさん学んでAI使って⼿を動かして仕事に活かし、アウトカムを増やすが吉。 お話を聞いてくださった皆様へのお⼟産(再現性ある学び) 「チームを作る」 - 1⼈⽬は⼤変なので早々に仲間を作ろう • 「事業貢献するまで云々」とたくさん話しましたが「チーム作り」めっちゃ⼤事。 • 「2⼈⽬のSREを」みたいに肩肘貼らなくても、眼の前の同僚‧仲間‧友達を愛そう。 • ⽣成AI時代、AIだらけだと疲れるので⼈を愛する、仲間を持つことも⼤事に(社内外両⽅で)。 結び