Upgrade to Pro — share decks privately, control downloads, hide ads and more …

一人SREが歩んだ Platform Engineering スモールスタート実践録

Avatar for syossan27 syossan27
September 18, 2025
39

一人SREが歩んだ Platform Engineering スモールスタート実践録

Platform Engineering Kaigi 2025の登壇資料です

Avatar for syossan27

syossan27

September 18, 2025
Tweet

More Decks by syossan27

Transcript

  1. ©MIXI 自己紹介 名前:しょっさん
 X(旧: Twitter)/ mixi2:@syossan27
 所属:株式会社 MIXI
 活動:
 •

    SRE Kaigi 実行委員長 • SRE Magazine 編集長 • ゆるSRE勉強会 共同運営 • 一般社団法人 SREコネクト 代表理事 • o11ycon コアスタッフ
  2. ©MIXI Platform EngineeringとSREの"交差点" Platform EngineeringとSRE、向いている方向が違うが重なるところがある Platform Engineering :「ストリームアラインドチーム 」の方向を向いている SRE:「プロダクトの信頼性

    」の方向を向いている Platform Engineering :「開発者の生産性を下げるトイル 」をなくそうとする SRE:「信頼性を脅かすトイル 」をなくそうとする 各々がグラデーションを持ってタスクをこなす中で「トイル」という点においては 重なりを持つ。
  3. ©MIXI "PE"の観点から遊撃活動を振り返り ゴールデンパスの整備 • CI/CDパイプラインの整備 • リリースプロセスの自動化 開発ワークフローの自動化と効率 化 •

    プレビュー・開発環境の整備 • 依存関係の管理 • スクラムプロセスの自動化 セルフサービスの実現 • QAチーム向け支援ツールの開発 • 開発環境の可視化・利用管理
  4. ©MIXI PEの実践① - Platform as Code Terraformを利用したIaCの導入 開発・ステージング・本番環境に跨ったGKE・IAM・Cloud Run・Cloud Run

    functions・Cloud Storageなどの各種Google CloudリソースをTerraformで管理 Google Cloudには gcloudを利用したリソースのbulk export があり、利用しながらコード 化 Platformに関するコードも管理 GHA、Slack botや、Chrome Extension、デプロイに利用しているスクリプトなど も管理 一部についてはデプロイフローも実装
  5. ©MIXI PEの実践② - 権限管理のセルフサービス化 Slack bot × AIでの実現 Slack botにOpenAI

    API(Responses API)を組み込み、VectorStore / Function Callingで実装することで、自然言語でメンションによるIAMの権限付与を実現
  6. ©MIXI PEの実践② - 権限管理のセルフサービス化 Slack bot × AIでの実現 Slack botにOpenAI

    API(Responses API)を組み込み、VectorStore / Function Callingで実装することで、自然言語でメンションによるIAMの権限付与を実現 ドキュメント検索もAIによる円滑化を目指し、実装中...
  7. ©MIXI PEの実践③ - ゴールデンパスの進化 Workload Identityの導入 Workload Identityを導入し、k8s podやGHAなどでセキュアな認証を実現 サービスアカウントキー管理が不要になり、セキュリティ上のリスクを排除

    CI/CD体験の向上 E2Eテストの導入、ArgoCDのSelf-managed化によるアップグレードの簡略化、 ArgoCD Notificationsの導入によるデプロイ状況の通知、テストカバレッジの整備、静 的解析ツールの導入(GraphQL Inspectorによる破壊的変更の検出、kubeconformによ るmanifest validation)、etc… k8s/GKEの安定化 Instance GroupでのNodeを通じたトラフィックルーティングから、Network Endpoint Groupを利用したPodへのルーティングへ変更( コンテナネイティブ負荷分散 ) 問題への対処療法としてのk8sカスタムコントローラーの作成など
  8. ©MIXI そうは言っても・・・ 勿論、現実として出来なかったことや失敗したことなどが多くあります。 ▪ リソースの限界 どうしても一人でやる場合、バックログは大量にストックされ優先順位付けを することが必須となります。 そのため、「 理想としてはやりたいが、急務ではない 」ものはどうしても優先

    度が下げられ、もどかしい気持ちになることが多々ありました。 ▪ "迷い"を解決する場が近くにない 周りにアイデアや設計の壁打ち相手がおらず、自分の視点だけで判断しなけれ ばならない難しさに厳しさを感じました。 「これをやらなくてよいのか?」「他にもよりスマートな解があるのでは?」 など迷いつつも、他の方の発信を参考に進めていました。
  9. ©MIXI 一人でも戦える武器 - AIの福音 最近は、これらの問題に対してAIがサポートしてくれています。 ▪ リソースの拡張 AIを並列実行させることで、限界はあれど大きくリソースを拡張させるこ とができるようになりました。広木大地さんが「 すべてのエンジニアは、

    AIをメンバーに持つEMになる 」と仰っていましたが、まさしく一人でや るといった概念がAIによって希薄化してきています。 ▪ 良き相談相手 AIは24時間いつでも・どれだけでも壁打ち相手となってくれます。 もちろん、全てを鵜呑みには出来ない部分はありますが、ある程度材料を 持ち寄って壁打ちをすると非常に示唆に富んだ回答をくれることが多いで す。