Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
IaaSにおけるPlatform Engineeringとこれから / Platform en...
Search
kazeburo
May 15, 2023
Technology
2
1.3k
IaaSにおけるPlatform Engineeringとこれから / Platform engineering in IaaS
IaaSにおけるPlatform Engineeringとこれから
Platform Engineering Meetup #2
2023/05/15
kazeburo
May 15, 2023
Tweet
Share
More Decks by kazeburo
See All by kazeburo
[SRE kaigi 2025] ガバメントクラウドに向けた開発と変化するSRE組織のあり方 / Development for Government Cloud and the Evolving Role of SRE Teams
kazeburo
4
2.4k
[さくらのTech Day] ガバメントクラウド開発と変化と成長する組織 / sakura techday, Develop govcloud and the team
kazeburo
0
6k
ガバメントクラウド開発と変化と成長する組織 / Organizational change and growth in developing a government cloud
kazeburo
4
2.6k
DNS水責め攻撃と監視 / DNS water torture attack Monitoring and SLO
kazeburo
5
4.2k
DBやめてみた / DNS water torture attack and countermeasures
kazeburo
13
13k
高信頼IaaSを実現するDevOps / DevOps for Highly Reliable IaaS
kazeburo
1
640
権威DNSサービスへのDDoSと ハイパフォーマンスなベンチマーカ / DNS Pseudo random subdomain attack and High performance Benchmarker
kazeburo
3
5.3k
DNS権威サーバのクラウドサービス向けに行われた攻撃および対策 / DNS Pseudo-Random Subdomain Attack and mitigations
kazeburo
7
13k
sacloudns
kazeburo
2
340
Other Decks in Technology
See All in Technology
組織に持ち込む脅威モデリング
nikinusu
2
630
Microsoft_20250311_AzureIoTPortfolio_PDF.pdf
iotcomjpadmin
0
240
RubyKaigi 2025でプロポーザルが初めて採択されるまでにやったこと
yuuu
1
100
技術を育てる組織・組織を育てる技術 / technology and organization
motemen
11
4.1k
やっぱり余白が大切だった話
kakehashi
PRO
7
2.8k
【ServiceNow SNUG Meetup LT deck】ServiceNow「検索性の進化」ZingからNow Assistまで
niwato
0
190
単一の深層学習モデルによる不確実性の定量化の紹介 ~その予測結果正しいですか?~
ftakahashi
PRO
3
430
Explainable Fintech: A Transdisciplinary Perspective
avandeursen
0
120
PHPStan をできる限り高速化してみる
colopl
0
160
ClineにNext.jsのプロジェクト改善をお願いしてみた / 20250321_reacttokyo_LT
optim
1
230
SLI/SLO・ラプソディあるいは組織への適用の旅
nwiizo
3
520
大人の学び - マイクの持ち方について
kawaguti
PRO
3
650
Featured
See All Featured
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
22
2.6k
Bash Introduction
62gerente
611
210k
Code Reviewing Like a Champion
maltzj
521
39k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Java REST API Framework Comparison - PWX 2021
mraible
29
8.4k
Testing 201, or: Great Expectations
jmmastey
42
7.3k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.3k
Navigating Team Friction
lara
183
15k
Fireside Chat
paigeccino
37
3.3k
Designing for Performance
lara
605
69k
Six Lessons from altMBA
skipperchong
27
3.7k
Transcript
Masahiro Nagano @kazeburo 2023/05/15 IaaSにおけるPlatform Engineeringとこれから(仮 Platform Engineering Meetup #2
Me • ⻑野雅広(ながのまさひろ) • Twitter/GitHub @kazeburo • さくらインターネット株式会社 クラウド事業本部
SRE室 室⻑ • mixi, livedoor (LINE), mercari を経て 2021年から現職
さくらのクラウド • 2011年のサービス開始から12年⽬ • 皆様のご⽀援のおかげです。 改めて感謝申し上げます
さくらのクラウド • 東京と⽯狩の2リージョンで展開 • 仮想サーバ/ディスク・ネットワークな どIaaS • VPCルータ、データベースなどの アプライアンス
• 2拠点での冗⻑化をサポートするロード バランサ、GSLB、DNSアプライアンス • スケールアップも可能なオートスケール
提供サービスの範囲拡⼤の取り組み お客様のDX化に向けたクラウド利⽤の様々なニーズに応え、 SaaS・PaaSへサービス提供範囲を拡⼤し、さらなる市場機会を創出 ヤマト宅急便の集荷依頼や匿名配送⼿続きが、ビジネス⽤の メッセージングアプリ「Slack」上でワンストップで⾏えるア プリケーションを本年2⽉より提供開始 エレコム株式会社、DXアンテナ株式会社と連携して、クラウ ド録画サービス「Antenna-eye」を2023年3⽉1⽇より提供開 始
ガバメントクラウドへの取り組み ガバメント領域での存在感を強めるため、ガバメント推進室が中⼼となりリレーションを構築 ガバメントクラウドをベンチマークとして「クラウドサービスの価値・技術⽔準を⾼める」
さくらのクラウド 開発の課題 これまでの10年を次の10年に繋ぐ • 既存のデータセンター・インフラ運⽤の維持継続 • IaaS コアシステムを現代化、技術⽔準の向上 • クラウドとして価値向上につながる機能拡充、新規サービス開発
⾼信頼とデリバリのパフォーマンスを両⽴
SRE / Platform Engineering
クラウド事業本部SRE室 • 2022年7⽉に発⾜。現在メンバーは5名 • 全社でのSREの取り組みがより評価されることを⽬的に発⾜ • 各部署でDevOps/SREの取り組みはされており、それを交換するものでは なく強化する • 社内での期待値のズレをなくすのが最初の課題
• 発⾜と同時にMission, Vision, Value の策定
SRE室のMission, Vision, Value • Mission • クラウドサービスの信頼性を⾼めることにより、お客様や社会のDXをしっかり⽀える • Vision •
社内でのSREの実践を広め、お客様への価値提供を⾏う • さくらのサービスそのものの信頼性向上、それにより価値向上を⽬指す • さくら社員がEnabling SREとして、お客様・社外のサービスの信頼性向上に携わる
SRE室のMission, Vision, Value • Value • 決め事を作るのではなく、⼀緒に”⼿を動かして”信頼性向上の⽂化をつくる • SRE室のエンジニアだけがSREs(Site Reliability
Engineers)ではない • SRE室のエンジニアが Embedded SRE / Enabling SREとして、SREの取り組みを拡⼤させていく • 開発・運⽤チームとの密なコミュニケーション • 期待値のズレ、お⾒合いを防ぐ • You built it, you run it • 開発/運⽤の両者が共通のゴールをもって、運⽤性に優れたソフトウェアを開発する
SRE室現在進⾏中の取り組み
SRE室現在進⾏中の取り組み • Kubernetes 基盤 • Sakura monitoring suite • Agile
culture の育成
Kubernetes 基盤
IUUQTLOPXMFEHFTBLVSBBEKQ
社内 Kubernetes 基盤 • 社内(プライベート)ネットワークに接続された「さくらのクラウド」上に開発 者が Kubernetes クラスタを構築できる基盤 • Cluster
API ベースで開発 • “マニフェスト”を元に、さくらのクラウドのAPIを利⽤しIaaSリソースを作 成する
ཧΫϥελ ϚχϑΣετཧ 3FQPTJUPSZ "SHP$% Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ
ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ ։ൃऀ ج൫ӡ༻ऀ Ϋϥελʹؔ͢Δ ϚχϡϑΣετΛ13 ϨϏϡʔ "VUP4ZOD CVJMENBOBHF CVJMENBOBHF ར༻
社内での Kubernetes 運⽤課題の洗い出し • 社内においていくつかのチームで独⾃にクラスタを運⽤ • さくらのクラウド上、物理サーバ上など環境は様々 • トラブル時の運⽤、クラスタのアップデートなどの課題は共通 •
課題をヒアリングから洗い出し、基盤開発へのフィードバック
社内 Kubernetes 運営コミュニティの開始 • SKOG “Sakura Kubernetes Operators Group” の発⾜
• Slack ベースでの情報共有 • オンラインでの勉強会の開催
社内 Kubernetes 基盤の課題 • 社内 Kubernetes 基盤への要望 • インターネットからのリーチャビリティ •
マルチリージョンの冗⻑性確保
社内 Kubernetes 基盤の課題 • 期待値のズレ • 開発者はアプリケーション実⾏基盤が欲しい • 基盤の利⽤は⼀部に限られている状態 •
Actions Runner Controllerなど
社内 Kubernetes 基盤の今後 • 「アプリケーションを動作させることに集中したい」を課題の中⼼に
社内 Kubernetes 基盤の今後 • 共有クラスタ(shared-k8s)の構築・運⽤ • Namespaceによるマルチテナント • 社外(インターネット)からのトラフィックを受付 •
堅牢性向上 / 東京・⽯狩での冗⻑性確保 • ログ、メトリクス永続化の組み込み • セルフサービスに基づいたポリシー
Sakura monitoring suite
Observability を⽀える課題 • ⻑期間のデータを格納するため⼤規模なストレージが必要 • ⾼可⽤性の担保。複雑なクラスタの運⽤ • 定期アップデートなどのメンテナンス
Sakura monitoring suite • Observability を実現する際の開発者にとっての負担を軽減 • monitoring suiteではメトリクスとログをサポート
Sakura monitoring suite (メトリクス) • Prometheus の Remote Storage を提供
• アルファ版として社内で提供中 • バックボーンネットワークの可視化 • エンハンスドDB(TiDB)
Sakura monitoring suite (ログ) • アクセスログや構造化ログに対して⾼速にクエリ • 低コストでの運⽤の実現、スケールするサービスを⽬指し開発中 • Trino(クエリエンジン)、Apache
Iceburg(テーブルフォーマット)を採⽤予定 • 開発者のneedsをとらえていくため Demo を重要視
Agile culture の育成
Enabling SREを通した⽂化の育成 • さくらのクラウドのアプライアンス開発・運⽤に課題 • ISSUEやお客様からの問い合わせ対応に遅延 • 該当アプライアンスサービスを活⽤した他のサービスに影響 • SRE室からEnabling
SREとしてチームに参加
Enabling SREとしての活動 • チームビルディング • オンラインでの朝(⼣)会、定例の開催 • 特定の個⼈に頼らないISSUE・障害対応 • Blamelessなふりかえり
• ドキュメンテーション⽂化 • ロードマップの作成
Enabling SREとしての今後 • Observability の向上 • Sakura monitoring suiteの活⽤ •
SLI/SLOの策定 • ⾼信頼というの価値提供 • ⾃律的なチームへ
Reading Club on Team building • SRE室と開発チームのリーダで開催 • 「⾔葉/⾔語」の共通化と課題の明確化 •
アジャイルの本部全体への展開 Four Keysなど次のアクション • メンバー同⼠の相互理解/信頼感の醸成
IaaSにおけるPlatform Engineeringとこれから • システムと⽂化の両⾯で⾼信頼のクラウドを⽀える • Platform Engineering (SRE as a
Serviceの提供) • アジャイル⽂化の醸成 • DevとOps / Dev と SREs の期待値を合わせる • MVVの定義 • アウトカムの最⼤化に必要
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ Perl, Go, Python
インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエン ジ ニア採⽤を強化しています さくらインターネットは新たなアイ デ アの創出に強い熱意と情熱を持って挑戦するお客様を は じ め、私たちとつな が りのあるす べ ての⼈たちのために、未来のある べ き姿を想い描きな が ら ―「やりたいこと」を「 で きる」に変える ― あらゆるア プ ローチを “インターネッ ト”を通 じ て提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/22engineer/
ご清聴ありがとうございました 質問などありましたらお気軽に