Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Cloud Nativeやる前とやりながら考えておきたいこと

Cloud Nativeやる前とやりながら考えておきたいこと

cndjp 第13回 俺たちの最適なCloud Nativeを求めて…。本気のこと始め!
(https://cnd.connpass.com/event/154414/) の発表資料です。

Ryoma Fujiwara

November 28, 2019
Tweet

More Decks by Ryoma Fujiwara

Other Decks in Technology

Transcript

  1. Cloud Native やる前とやりながら考えておきたいこと 1 (C) Recruit TechnologiesCo.,Ltd. All rights reserved.

    גࣜձࣾžŞſŖŪũŞůƁŢƄŖţƄ ITŚƃŢƄŬŗžƃŞƄຊ෦ ŲƅƁŦƄŞũŎűƄũŎŚƃŢƄŬŗžƃŞƄ෦ ŞŽřŪƄŗŖŝũŞŪŞƄſŖŲƅ ౻ݪ ྋഅ
  2. ⾃⼰紹介 藤原 涼⾺ 株式会社リクルートテクノロジーズ ITエンジニアリング本部プロダクティビティエンジニアリング部 クラウドアーキテクトグループ 経歴 2011-2015 ユーザ系SIer にてR&D

    2016/1〜 リクルートテクノロジーズに⼊社 主な活動(社外含む) • コンテナ・クラウド等の先進アーキテクチャの事業への装着 • Rancher JPコアメンバー • 各種勉強会登壇 (Rancher JP meetup, Docker meetup tokyo, Japan Container Days, Cloud Native Daysほか) • 寄稿 @IT 先⾏事例に学ぶKubernetes 企業活⽤の現実・コンテナベースのCI/CD本番事例⼤解剖, ThinkIT マルチクラウド時代の最強コンビ RancherによるKubernetes活⽤ガイド) • 執筆 • RancherによるKubernetes活⽤ガイド(Think IT Books, インプレス) 2 (C) Recruit Technologies Co.,Ltd. All rights reserved.
  3. リクルートグループの紹介 3 (C) Recruit Technologies Co.,Ltd. All rights reserved. 創業

    1960年3⽉31⽇ 「⼤学新聞広告社」としてスタート グループ 従業員数 45,856名 (2019年3⽉31⽇時点) 連結売上⾼ 23,107億円 (2018年4⽉1⽇〜2019年3⽉31⽇) 連結営業利益 2,230億円 (2018年4⽉1⽇〜2019年3⽉31⽇) グループ 企業数 344社 (⼦会社および関連会社、2019年3⽉31⽇時点) ⽬指す世界観 「あなた」を⽀える存在でありたい
  4. 所属組織の紹介: リクルートテクノロジーズ 5 (C) Recruit Technologies Co.,Ltd. All rights reserved.

    リクルートグループのビジネス・サービス リクルートテクノロジーズ IT・マーケティング ソリューション ビジネス視点の ITマネジメント 横断的にソリューションを提供 上記は対象企業・サービスの⼀部抜粋です。
  5. そもそもCloud Nativeって?(もう少しわかりやすく) ⾔い直すと以下の要件を満たす技術 • 様々なレイヤの仮想化を活⽤ • ⾃動で⼤⼩の障害から復旧 • ⾼い管理性を備える •

    詳細まで観測できる • 積極的に⾃動化している 上記を通じてアプリケーション・インフラの⼤胆な変更を 少ない労⼒で実施できる技術 13 (C) Recruit Technologies Co.,Ltd. All rights reserved.
  6. そもそもCloud Nativeって?(もう少しわかりやすく) ⾔い直すと以下の要件を満たす技術 • 様々なレイヤの仮想化を活⽤ • ⾃動で⼤⼩の障害から復旧 • ⾼い管理性を備える •

    詳細まで観測できる • 積極的に⾃動化している 上記を通じてアプリケーション・インフラの⼤胆な変更を 少ない労⼒で実施できる技術 14 (C) Recruit Technologies Co.,Ltd. All rights reserved. とはいえこれで⼤丈夫か?そんなに簡単な話なのか? 追加で考えないといけないこと、注意点を挙げてみる。
  7. ⾃動で⼤⼩の障害から復旧する Kubernetesをいれれば終わり • そもそもの障害種別の分類と対処⽅法 • 障害といってもいろいろあるけど、それぞれの障害をどうカバーするか • どこまでの障害対策をスコープに含めるか? • AWSでいうと単⼀のインスタンス・単⼀AZ・単⼀リージョン全体、どこまでをスコープ

    にして復旧または、サービスへの影響が発⽣しないようにするか? • 定めたスコープに対してどうやってSPOFを排除するか? 17 (C) Recruit Technologies Co.,Ltd. All rights reserved. どの程度の障害まで配慮するか、それぞれの障害に対して どのような⼿法・テクノロジーで対処するかを考える。 (たしかにk8sはこのレイヤではかなり強⼒なテクノロジーであることは事実)
  8. ⾃動で⼤⼩の障害から復旧する Kubernetesをいれれば終わり • そもそもの障害種別の分類と対処⽅法 • 障害といってもいろいろあるけど、それぞれの障害をどうカバーするか • どこまでの障害対策をスコープに含めるか? • AWSでいうと単⼀のインスタンス・単⼀AZ・単⼀リージョン全体、どこまでをスコープ

    にして復旧または、サービスへの影響が発⽣しないようにするか? • 定めたスコープに対してどうやってSPOFを排除するか? 18 (C) Recruit Technologies Co.,Ltd. All rights reserved. そこまで考えた上でKubernetesなり、ECSなりのテクノロジーの 備える諸機能で対応するといった話になる
  9. ⾼い管理性を備える 管理性が⾼いとはそもそもどういうことか? • ⼿間がかからない(間違ってはないが…) • コードによる管理が可能 21 (C) Recruit Technologies

    Co.,Ltd. All rights reserved. コードによる管理が可能 = ソフトウェア⼯学的な改善アプローチが適⽤しやすくなる
  10. ⾼い管理性を備える 管理性が⾼いとはそもそもどういうことか? • ⼿間がかからない(間違ってはないが…) • コードによる管理が可能 22 (C) Recruit Technologies

    Co.,Ltd. All rights reserved. コードによる管理が可能 = ソフトウェア⼯学的な改善アプローチが適⽤しやすくなる ⼯学的な改善アプローチがポイント 種々の活動の再現性向上(≒属⼈性の低減)を実現するための⼿段を考えられるようになる
  11. 詳細まで観測することができる 道具は揃っている(OSSから商⽤まで幅広く) • 詳細まで観測してどうする? 25 (C) Recruit Technologies Co.,Ltd. All

    rights reserved. 観測結果(特に平常時と異なる状態が⾒られた場合)に応じた アクションにつながるものでなければ価値は低い。
  12. 詳細まで観測することができる 道具は揃っている(OSSから商⽤まで幅広く) • 詳細まで観測してどうする? 26 (C) Recruit Technologies Co.,Ltd. All

    rights reserved. 観測結果(特に平常時と異なる状態が⾒られた場合)に応じた アクションにつながるものでなければ価値は低い。 クラウドネイティブ技術はアクションを⾃動化することを容易にはする。
  13. 詳細まで観測することができる 道具は揃っている(OSSから商⽤まで幅広く) • 詳細まで観測してどうする? 27 (C) Recruit Technologies Co.,Ltd. All

    rights reserved. 観測結果(特に平常時と異なる状態が⾒られた場合)に応じた アクションにつながるものでなければ価値は低い。 クラウドネイティブ技術はアクションを⾃動化することを容易にはする。 どんなアクションをとるかについては⼈間が考えなければいけない
  14. ⾃動化が積極的に⾏われている ⾃動化するだけでは運⽤が最終的に破綻する • メンテナンス可能な⾃動化形態にできるか • 可能な限り環境が異なる場合も同じコード・設定で利⽤できるか • 環境による可変部分を最⼩化できるか 29 (C)

    Recruit Technologies Co.,Ltd. All rights reserved. ただし、相⼿はコードなのでまだ打つ⼿はある ソースコードのリファクタリングといった話になる (あまりコード書いたりが得意でないインフラエンジニアにはおそらく最も⾟いところ)
  15. クラウドネイティブ技術 ⾒直してみる ⾔い直すと以下の要件を満たす技術 • 様々なレイヤの仮想化を活⽤ • ⾃動で⼤⼩の障害から復旧 • ⾼い管理性を備える •

    詳細まで観測できる • 積極的に⾃動化している 上記を通じてアプリケーション・インフラの⼤胆な変更を 少ない労⼒で実施できる技術 30 (C) Recruit Technologies Co.,Ltd. All rights reserved.
  16. 考えなければいけないことはたくさんあるが… • 実はクラウドネイティブ関係なく本来は考えなきゃいけないこと • IPAの⾮機能要求グレードなどを広く捉えた場合 (https://www.ipa.go.jp/sec/softwareengineering/std/ent03-b.html) 33 (C) Recruit Technologies

    Co.,Ltd. All rights reserved. クラウドネイティブ技術は⾮機能に関連した課題について 部分的ではあるものの標準的かつ(以前に⽐べて)実現が容易な解決案をあたえてくれるだけ それを活かすプロセスについてはノータッチ(あくまでも技術なので)
  17. クラウドネイティブ技術 と DevOps クラウドネイティブ技術 + DevOps⽂化・プロセス • クラウドネイティブ技術 • ⾼い⾮機能品質を実現するため技術を提供

    • ⾼頻度なデプロイを⽀援するための仕組みを提供(特に重要なポイントなので抽出) • DevOps⽂化・プロセス • ⾼速な仮説検証サイクルを回すための組織⽂化・プロセスを醸成 • ビジネスに直接貢献する部分はこちら 38 (C) Recruit Technologies Co.,Ltd. All rights reserved.
  18. クラウドネイティブ技術 と DevOps クラウドネイティブ技術 + DevOps⽂化・プロセス • クラウドネイティブ技術 • ⾼い⾮機能品質を実現するため技術を提供

    • ⾼頻度なデプロイを⽀援するための仕組みを提供(特に重要なポイントなので抽出) • DevOps⽂化・プロセス • ⾼速な仮説検証サイクルを回すための組織⽂化・プロセスを醸成 • ビジネスに直接貢献する部分はこちら 39 (C) Recruit Technologies Co.,Ltd. All rights reserved. ⽂化やプロセスがあって初めてクラウドネイティブ技術が活きる。 ⽂化やプロセスを技術でブースト(≒実現を容易化・効果を最⼤化)する
  19. DepOps + クラウドネイティブ技術において特に重要な技術的ポイント • コードリポジトリ(⼤前提) • 様々なレイヤのコード化を通じた再現性の向上 • テストの⾃動化 +

    テスト駆動開発(+ テスト環境の動的な払い出し) • テスト駆動開発と開発スピードについては下記URLを参照 • 質とスピード(https://speakerdeck.com/twada/quality-and-speed, t-wada) • デプロイプロセスのシンプル化・⾃動化 40 (C) Recruit Technologies Co.,Ltd. All rights reserved.
  20. DepOps + クラウドネイティブ技術において特に重要な技術的ポイント • コードリポジトリ(⼤前提) • 様々なレイヤのコード化を通じた再現性の向上 • テストの⾃動化 +

    テスト駆動開発(+ テスト環境の動的な払い出し) • テスト駆動開発と開発スピードについては下記URLを参照 • 質とスピード(https://speakerdeck.com/twada/quality-and-speed, t-wada) • デプロイプロセスのシンプル化・⾃動化 41 (C) Recruit Technologies Co.,Ltd. All rights reserved. エンジニア個々⼈が品質に対する責任を果たしやすくする ここまでやったからには失敗したら誰のせいとかではないよねと⾔える状態 の実現を⽬指す。
  21. DepOps + クラウドネイティブ技術において特に重要な技術的ポイント • コードリポジトリ(⼤前提) • 様々なレイヤのコード化を通じた再現性の向上 • テストの⾃動化 +

    テスト駆動開発(+ テスト環境の動的な払い出し) • テスト駆動開発と開発スピードについては下記URLを参照 • 質とスピード(https://speakerdeck.com/twada/quality-and-speed, t-wada) • デプロイプロセスのシンプル化・⾃動化 42 (C) Recruit Technologies Co.,Ltd. All rights reserved. エンジニア個々⼈が品質に対する責任を果たしやすくする ここまでやったからには失敗したら誰のせいとかではないよねと⾔える状態 の実現を⽬指す。 ⾮難のないポストモーテムとそこからの確実な学びへと繋げる
  22. Cloud Native Trail Map 49 (C) Recruit Technologies Co.,Ltd. All

    rights reserved. https://github.com/cncf/trailmap
  23. Cloud Native Trail Map 50 (C) Recruit Technologies Co.,Ltd. All

    rights reserved. https://github.com/cncf/trailmap 1. コンテナ化 2. CI/CD 3. オーケストレーション ・アプリケーション定義 4. 可観測性と分析 5. サービスプロキシ ・ディスカバリ・メッシュ
  24. Cloud Native Trail Map 51 (C) Recruit Technologies Co.,Ltd. All

    rights reserved. https://github.com/cncf/trailmap 1. コンテナ化 2. CI/CD 3. オーケストレーション ・アプリケーション定義 4. 可観測性と分析 5. サービスプロキシ ・ディスカバリ・メッシュ いったん5までで解説 (6以降は完全に未経験なので)
  25. Cloud Native Trail Map 1. コンテナ化 2. CI/CD 3. オーケストレーション・アプリケーション定義

    4. 可観測性と分析 5. サービスプロキシ・ディスカバリ・メッシュ 52 (C) Recruit Technologies Co.,Ltd. All rights reserved. 個別の項⽬で特に何を達成することを期待するかを意識する
  26. Cloud Native Trail Map (何を達成することを期待するかの⼀例) 1. コンテナ化 – ビルドの定型化 2.

    CI/CD – テストプロセスの定型化 – デプロイプロセスの定型化 3. オーケストレーション・アプリケーション定義 – デプロイ後の定性的な⾮機能品質の実現 – ある程度複雑なアプリケーションのデプロイプロセスの単純化・定型化 4. 可観測性と分析 – デプロイ後の定量的な⾮機能品質の測定 – 観測結果を⽤いた改善の判断 5. サービスプロキシ・ディスカバリ・メッシュ – より複雑なデプロイプロセスの実現(カナリアリリースなど) 53 (C) Recruit Technologies Co.,Ltd. All rights reserved.
  27. Cloud Native Trail Map (何を期待するのかの⼀例) 1. コンテナ化 – ビルドの定型化 2.

    CI/CD – テストプロセスの定型化 – デプロイプロセスの定型化 3. オーケストレーション・アプリケーション定義 – デプロイ後の定性的な⾮機能品質の実現 – ある程度複雑なアプリケーションのデプロイプロセスの単純化・定型化 4. 可観測性と分析 – デプロイ後の定量的な⾮機能品質の測定 – 観測結果を⽤いた改善の判断 5. サービスプロキシ・ディスカバリ・メッシュ – より複雑なデプロイプロセスの実現(カナリアリリースなど) 54 (C) Recruit Technologies Co.,Ltd. All rights reserved. ツール選定・個別の機能をどこで実現するかについては を期待する内容を軸にして考えると納得感のある構成となりやすい (参考) Kubernetes、コンテナ技術を活⽤した開発アジリティー向上にインフラアーキテクトはどう貢献したのか (@IT, https://www.atmarkit.co.jp/ait/articles/1902/18/news013.html)
  28. どこまで登るか? 既存の組織としての技術資産 を意識する 56 (C) Recruit Technologies Co.,Ltd. All rights

    reserved. いきなり、Docker, Kubernetes, Helm, Istioと…… みたいなことをすると破綻しやすい。 細かくステップを刻む
  29. どこまで登るか? 既存の組織としての技術資産 を意識する 57 (C) Recruit Technologies Co.,Ltd. All rights

    reserved. いきなりジャンプアップはできない ただし過去や他の事例から学んでスピードアップはできる いきなり、Docker, Kubernetes, Helm, Istioと…… みたいなことをすると破綻しやすい。 細かくステップを刻む