Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
IaaSにおけるPlatform Engineeringとこれから / Platform en...
Search
kazeburo
May 15, 2023
Technology
2
1.3k
IaaSにおけるPlatform Engineeringとこれから / Platform engineering in IaaS
IaaSにおけるPlatform Engineeringとこれから
Platform Engineering Meetup #2
2023/05/15
kazeburo
May 15, 2023
Tweet
Share
More Decks by kazeburo
See All by kazeburo
[さくらのTech Day] ガバメントクラウド開発と変化と成長する組織 / sakura techday, Develop govcloud and the team
kazeburo
0
13
ガバメントクラウド開発と変化と成長する組織 / Organizational change and growth in developing a government cloud
kazeburo
4
1.8k
DNS水責め攻撃と監視 / DNS water torture attack Monitoring and SLO
kazeburo
5
4k
DBやめてみた / DNS water torture attack and countermeasures
kazeburo
13
12k
高信頼IaaSを実現するDevOps / DevOps for Highly Reliable IaaS
kazeburo
1
560
権威DNSサービスへのDDoSと ハイパフォーマンスなベンチマーカ / DNS Pseudo random subdomain attack and High performance Benchmarker
kazeburo
3
5.2k
DNS権威サーバのクラウドサービス向けに行われた攻撃および対策 / DNS Pseudo-Random Subdomain Attack and mitigations
kazeburo
7
13k
sacloudns
kazeburo
2
320
「orchestratorとGTID運用を支える監視」の勉強 / Monitoring orchestrator and GTID operation
kazeburo
2
1.3k
Other Decks in Technology
See All in Technology
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
150
SSMRunbook作成の勘所_20241120
koichiotomo
1
110
Amplify Gen2 Deep Dive / バックエンドの型をいかにしてフロントエンドへ伝えるか #TSKaigi #TSKaigiKansai #AWSAmplifyJP
tacck
PRO
0
370
Amazon CloudWatch Network Monitor のススメ
yuki_ink
1
200
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
Terraform Stacks入門 #HashiTalks
msato
0
350
ノーコードデータ分析ツールで体験する時系列データ分析超入門
negi111111
0
410
20241120_JAWS_東京_ランチタイムLT#17_AWS認定全冠の先へ
tsumita
2
230
個人でもIAM Identity Centerを使おう!(アクセス管理編)
ryder472
3
180
強いチームと開発生産性
onk
PRO
33
11k
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
第1回 国土交通省 データコンペ参加者向け勉強会③- Snowflake x estie編 -
estie
0
120
Featured
See All Featured
Art, The Web, and Tiny UX
lynnandtonic
297
20k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
Rails Girls Zürich Keynote
gr2m
94
13k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
27
840
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Teambox: Starting and Learning
jrom
133
8.8k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
The Cult of Friendly URLs
andyhume
78
6k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
16
2.1k
Transcript
Masahiro Nagano @kazeburo 2023/05/15 IaaSにおけるPlatform Engineeringとこれから(仮 Platform Engineering Meetup #2
Me • ⻑野雅広(ながのまさひろ) • Twitter/GitHub @kazeburo • さくらインターネット株式会社 クラウド事業本部
SRE室 室⻑ • mixi, livedoor (LINE), mercari を経て 2021年から現職
さくらのクラウド • 2011年のサービス開始から12年⽬ • 皆様のご⽀援のおかげです。 改めて感謝申し上げます
さくらのクラウド • 東京と⽯狩の2リージョンで展開 • 仮想サーバ/ディスク・ネットワークな どIaaS • VPCルータ、データベースなどの アプライアンス
• 2拠点での冗⻑化をサポートするロード バランサ、GSLB、DNSアプライアンス • スケールアップも可能なオートスケール
提供サービスの範囲拡⼤の取り組み お客様のDX化に向けたクラウド利⽤の様々なニーズに応え、 SaaS・PaaSへサービス提供範囲を拡⼤し、さらなる市場機会を創出 ヤマト宅急便の集荷依頼や匿名配送⼿続きが、ビジネス⽤の メッセージングアプリ「Slack」上でワンストップで⾏えるア プリケーションを本年2⽉より提供開始 エレコム株式会社、DXアンテナ株式会社と連携して、クラウ ド録画サービス「Antenna-eye」を2023年3⽉1⽇より提供開 始
ガバメントクラウドへの取り組み ガバメント領域での存在感を強めるため、ガバメント推進室が中⼼となりリレーションを構築 ガバメントクラウドをベンチマークとして「クラウドサービスの価値・技術⽔準を⾼める」
さくらのクラウド 開発の課題 これまでの10年を次の10年に繋ぐ • 既存のデータセンター・インフラ運⽤の維持継続 • IaaS コアシステムを現代化、技術⽔準の向上 • クラウドとして価値向上につながる機能拡充、新規サービス開発
⾼信頼とデリバリのパフォーマンスを両⽴
SRE / Platform Engineering
クラウド事業本部SRE室 • 2022年7⽉に発⾜。現在メンバーは5名 • 全社でのSREの取り組みがより評価されることを⽬的に発⾜ • 各部署でDevOps/SREの取り組みはされており、それを交換するものでは なく強化する • 社内での期待値のズレをなくすのが最初の課題
• 発⾜と同時にMission, Vision, Value の策定
SRE室のMission, Vision, Value • Mission • クラウドサービスの信頼性を⾼めることにより、お客様や社会のDXをしっかり⽀える • Vision •
社内でのSREの実践を広め、お客様への価値提供を⾏う • さくらのサービスそのものの信頼性向上、それにより価値向上を⽬指す • さくら社員がEnabling SREとして、お客様・社外のサービスの信頼性向上に携わる
SRE室のMission, Vision, Value • Value • 決め事を作るのではなく、⼀緒に”⼿を動かして”信頼性向上の⽂化をつくる • SRE室のエンジニアだけがSREs(Site Reliability
Engineers)ではない • SRE室のエンジニアが Embedded SRE / Enabling SREとして、SREの取り組みを拡⼤させていく • 開発・運⽤チームとの密なコミュニケーション • 期待値のズレ、お⾒合いを防ぐ • You built it, you run it • 開発/運⽤の両者が共通のゴールをもって、運⽤性に優れたソフトウェアを開発する
SRE室現在進⾏中の取り組み
SRE室現在進⾏中の取り組み • Kubernetes 基盤 • Sakura monitoring suite • Agile
culture の育成
Kubernetes 基盤
IUUQTLOPXMFEHFTBLVSBBEKQ
社内 Kubernetes 基盤 • 社内(プライベート)ネットワークに接続された「さくらのクラウド」上に開発 者が Kubernetes クラスタを構築できる基盤 • Cluster
API ベースで開発 • “マニフェスト”を元に、さくらのクラウドのAPIを利⽤しIaaSリソースを作 成する
ཧΫϥελ ϚχϑΣετཧ 3FQPTJUPSZ "SHP$% Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ
ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ Ϛελʔ ϊʔυ Ϛελʔ ϊʔυ. ϫʔΧʔ ϊʔυ ϫʔΧʔ ϊʔυ8 ϢʔβΫϥελ ։ൃऀ ج൫ӡ༻ऀ Ϋϥελʹؔ͢Δ ϚχϡϑΣετΛ13 ϨϏϡʔ "VUP4ZOD CVJMENBOBHF CVJMENBOBHF ར༻
社内での Kubernetes 運⽤課題の洗い出し • 社内においていくつかのチームで独⾃にクラスタを運⽤ • さくらのクラウド上、物理サーバ上など環境は様々 • トラブル時の運⽤、クラスタのアップデートなどの課題は共通 •
課題をヒアリングから洗い出し、基盤開発へのフィードバック
社内 Kubernetes 運営コミュニティの開始 • SKOG “Sakura Kubernetes Operators Group” の発⾜
• Slack ベースでの情報共有 • オンラインでの勉強会の開催
社内 Kubernetes 基盤の課題 • 社内 Kubernetes 基盤への要望 • インターネットからのリーチャビリティ •
マルチリージョンの冗⻑性確保
社内 Kubernetes 基盤の課題 • 期待値のズレ • 開発者はアプリケーション実⾏基盤が欲しい • 基盤の利⽤は⼀部に限られている状態 •
Actions Runner Controllerなど
社内 Kubernetes 基盤の今後 • 「アプリケーションを動作させることに集中したい」を課題の中⼼に
社内 Kubernetes 基盤の今後 • 共有クラスタ(shared-k8s)の構築・運⽤ • Namespaceによるマルチテナント • 社外(インターネット)からのトラフィックを受付 •
堅牢性向上 / 東京・⽯狩での冗⻑性確保 • ログ、メトリクス永続化の組み込み • セルフサービスに基づいたポリシー
Sakura monitoring suite
Observability を⽀える課題 • ⻑期間のデータを格納するため⼤規模なストレージが必要 • ⾼可⽤性の担保。複雑なクラスタの運⽤ • 定期アップデートなどのメンテナンス
Sakura monitoring suite • Observability を実現する際の開発者にとっての負担を軽減 • monitoring suiteではメトリクスとログをサポート
Sakura monitoring suite (メトリクス) • Prometheus の Remote Storage を提供
• アルファ版として社内で提供中 • バックボーンネットワークの可視化 • エンハンスドDB(TiDB)
Sakura monitoring suite (ログ) • アクセスログや構造化ログに対して⾼速にクエリ • 低コストでの運⽤の実現、スケールするサービスを⽬指し開発中 • Trino(クエリエンジン)、Apache
Iceburg(テーブルフォーマット)を採⽤予定 • 開発者のneedsをとらえていくため Demo を重要視
Agile culture の育成
Enabling SREを通した⽂化の育成 • さくらのクラウドのアプライアンス開発・運⽤に課題 • ISSUEやお客様からの問い合わせ対応に遅延 • 該当アプライアンスサービスを活⽤した他のサービスに影響 • SRE室からEnabling
SREとしてチームに参加
Enabling SREとしての活動 • チームビルディング • オンラインでの朝(⼣)会、定例の開催 • 特定の個⼈に頼らないISSUE・障害対応 • Blamelessなふりかえり
• ドキュメンテーション⽂化 • ロードマップの作成
Enabling SREとしての今後 • Observability の向上 • Sakura monitoring suiteの活⽤ •
SLI/SLOの策定 • ⾼信頼というの価値提供 • ⾃律的なチームへ
Reading Club on Team building • SRE室と開発チームのリーダで開催 • 「⾔葉/⾔語」の共通化と課題の明確化 •
アジャイルの本部全体への展開 Four Keysなど次のアクション • メンバー同⼠の相互理解/信頼感の醸成
IaaSにおけるPlatform Engineeringとこれから • システムと⽂化の両⾯で⾼信頼のクラウドを⽀える • Platform Engineering (SRE as a
Serviceの提供) • アジャイル⽂化の醸成 • DevとOps / Dev と SREs の期待値を合わせる • MVVの定義 • アウトカムの最⼤化に必要
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ Perl, Go, Python
インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエン ジ ニア採⽤を強化しています さくらインターネットは新たなアイ デ アの創出に強い熱意と情熱を持って挑戦するお客様を は じ め、私たちとつな が りのあるす べ ての⼈たちのために、未来のある べ き姿を想い描きな が ら ―「やりたいこと」を「 で きる」に変える ― あらゆるア プ ローチを “インターネッ ト”を通 じ て提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/22engineer/
ご清聴ありがとうございました 質問などありましたらお気軽に