経路探索をスケールさせるクラウドネイティブなインフラへ

Slide 1

Slide 1 text

©NAVITIME JAPAN 経路探索をスケールさせるクラウドネイティブなインフラへ株式会社ナビタイムジャパン ACTS(研究開発)インフラグループ MicroudPJ　清水健司 2019/9/20

Slide 2

Slide 2 text

©NAVITIME JAPAN 自己紹介清水健司 ● クラウド移行メインのインフラエンジニア ● Docker/Kubernetes/Spinnaker ● たまにJavaとGo ● AWS認定SAアソシエイト ● 筆圧強め

Slide 3

Slide 3 text

©NAVITIME JAPAN なぜコンテナという技術選択に至ったか

Slide 4

Slide 4 text

©NAVITIME JAPAN NAVITIMEのサービス概要 Our Products 公共交通ドライブツーリング外国人＆海外トラベル＆フィットネス PC / SPブラウザ NAVITIME 乗換NAVITIME バスNAVITIME こみれぽドライブサポーターカーナビタイムトラックカーナビツーリングサポーター自転車NAVITIME NAVITIME for Japan Travel NAVITIME Transit NAVITIME Travel ALKOO PLAT

Slide 5

Slide 5 text

©NAVITIME JAPAN NAVITIMEのサービス概要 Our Products ビジネスナビタイム動態管理ソリューションビジネスナビタイム交通費精算パッケージ広告 / アライアンスオウンドメディア交通コンサルティング電鉄・バス事業者向けソリューション API / SDK テレマティクスサービス

Slide 6

Slide 6 text

©NAVITIME JAPAN NAVITIMEの特徴移動の需要によってサーバの負荷が大きく変動 ● 通勤時間帯 ○ 出勤 / 退勤時にアクセスのピーク

Slide 7

Slide 7 text

©NAVITIME JAPAN NAVITIMEの特徴移動の需要によってサーバの負荷が大きく変動 ● GWや長期休暇 ○ カーナビサービスはアクセス増 ● 豪雨などの災害 ○ 乗換アプリなどのアクセス急増 ● テレビ広告 ○ オウンドメディアへのスパイクアクセス

Slide 8

Slide 8 text

©NAVITIME JAPAN NAVITIMEの特徴コア技術を生かした幅広いサービス展開 ● 事業毎に共通のAPIサーバ ○ 中身は同じだが運用のしやすさや障害時の影響を考え別のサーバグループとしている共通APIサーバ載っているプロダクトは同じ

Slide 9

Slide 9 text

©NAVITIME JAPAN NAVITIMEの特徴コア技術を生かした幅広いサービス展開 ● スピード感を持った事業展開 ○ BtoC：アイデアを実現させた新機能やサービス ○ BtoB：案件ベースで新サービスのローンチ

Slide 10

Slide 10 text

©NAVITIME JAPAN オンプレ運用時の苦しいところ ● スケールできない ○ 予想できる高トラフィックは前もって増設ができるが、予期できない場合は現状のサーバで捌くしかない ○ 前もって増設するのも運用コストがかかる ● サービス展開までのリードタイム ○ 新しくサーバを調達するのに時間がかかるため、新規サービス立ち上げに時間がかかる

Slide 11

Slide 11 text

Slide 12

Slide 12 text

©NAVITIME JAPAN なぜコンテナに移行したかクラウドの良さを引き出してくれる ● クラウドの場合にVMよりもコンテナの方が運用が楽 ● マルチクラウドでの運用を見据えたときに、アプリケーションのポータビリティが非常に強みになる aws gcp

Slide 13

Slide 13 text

©NAVITIME JAPAN なぜコンテナに移行したかマネージドサービスが充実している ● コンテナオーケストレーションをする際に肝心なマスターノードの管理/冗長化をする必要性がない ● クラウドベンダーやOSSコミュニティがものすごいスピードで機能追加/改善を行っている → 巨人の肩に乗ってモダンな構成を組むことができる

Slide 14

Slide 14 text

©NAVITIME JAPAN 移行した結果 9月9日台風上陸時の突発的なアクセス増（乗換）アクセス数サーバ台数

Slide 15

Slide 15 text

©NAVITIME JAPAN オンプレの構成のままクラウドで動かすのは難しい

Slide 16

Slide 16 text

©NAVITIME JAPAN オンプレの構成のまま持っていけるかオンプレの構成はVM上でアプリケーションを稼働 ● コンテナ化は単純にコードに起こすだけではアプリケーションを健全に運用できない 1プロセス = 1コンテナが基本 ● オンプレのサーバはstatefulかつmutable クラウドで扱うコンテナはstatelessかつimmutable

Slide 17

Slide 17 text

Slide 18

Slide 18 text

©NAVITIME JAPAN コンテナ設計のデザインパターンを利用するアプリケーションのコンテナ化 ○ シングルノードのコンポーネントを別々のコンテナで動かす ○ コンテナ化のゴールは境界を設けること ○ どんな境界か ■ リソースの境界 ■ チームのオーナーシップの境界 ■ 関心の分離の境界

Slide 19

Slide 19 text

©NAVITIME JAPAN サイドカーパターン「メインのコンテナに加えて　補助的な機能を追加するコンテナを内包する」パターン ﬂuentdコンテナにアクセスログとアプリケーションログをオブジェクトストレージに転送する責務を委譲する各コンテナがボリュームを通してファイルを共有できる特徴を生かしている tomcat httpd fluentd LOG LOG

Slide 20

Slide 20 text

©NAVITIME JAPAN ステートフルからステートレスへデータ配信方法の最適化 ○ 地図や時刻表、インデックスデータはインスタンスもしくはコンテナ群の起動時に取得する必要性がある ■ EC2のユーザデータを使用してEBSをアタッチする ■ データ取得の責務を担うコンテナを用意するサイドカーパターンを利用する gcloud solr file file file file file SDKを含むコンテナがCloud Storageからインデックスファイル群を取得

Slide 21

Slide 21 text

©NAVITIME JAPAN 構成を見直し得られたもの ● リソースの境界 ○ ベストエフォートのサービスのコンテナは割当を少なくして、メインのコンテナのレイテンシが他サービスのリソース消費によって増大しないようにできる割当リソース httpd tomcat fluentd 他... アプリケーションのPFに直結するメインのコンテナ郡ベストエフォート

Slide 22

Slide 22 text

©NAVITIME JAPAN 構成を見直し得られたもの ● チームのオーナーシップの境界 ○ ﬂuentdコンテナの改善はアプリケーションコンテナを管理するPJ でなく、クラウドインフラを管轄するPJが行うことができている ■ コンテナが分かれているので所有権が明確例： ● httpdとtomcatは開発チームが改修 ● ログ転送エージェントのﬂuentdはインフラが改修 ● 場合によってはプルリク or モブで情報共有

Slide 23

Slide 23 text

©NAVITIME JAPAN クラウド環境に適したデプロイを目指す

Slide 24

Slide 24 text

©NAVITIME JAPAN Infrastructure as Codeは達成できたか ● Dockerで環境構築手順をCode化できた ● 複数のコンテナの定義を管理するファイルもちゃんとGitで管理できている ○ Amazon ECSでのタスク定義 (json) ○ KubernetesにおけるDeployment (yaml) 達成できた…？

Slide 25

Slide 25 text

Slide 26

Slide 26 text

©NAVITIME JAPAN なぜ差が出来てしまったのか ● リリースした後、手でマニフェストに追いつきをかける運用になっていた ○ この作業が抜けてしまうケースが多かったが、抜けてしまっても問題ない状態となっていることにも原因の一端がある BitBucket 現在動いているタスク定義を取得しタグを書き換えて適用コンテナのタグを指定してジョブ実行

Slide 27

Slide 27 text

©NAVITIME JAPAN なぜ差が出来てしまったのか ● 一部を除いてインフラが手で設定を変更する運用になっていた ○ インフラエンジニア以外はジョブを通してコンテナのタグ変更のみしか出来ない状態にあったタグ以外はインフラが変更

Slide 28

Slide 28 text

©NAVITIME JAPAN 差が出ることで起きるデメリット ● 定義した項目がAWS側のデフォルト設定なのか意図した設定なのかがコンソールから判断できない "containerDefinitions": [ { "name": "web", "image": "httpd:hoge", "cpu": 128, "memoryReservation": 450, "links": [ "app:app" ], "containerDefinitions": [ { "dnsSearchDomains": null, "logConfiguration": null, "entryPoint": null, "image": "httpd:hoge", "startTimeout": null, "firelensConfiguration": null, "dependsOn": null, "disableNetworking": null, "interactive": null, "healthCheck": null, "links": [ "app:app" ], 適用するファイル適用後に確認できる画面適用したファイルにタスク定義の全ての項目が追加されデフォルト値が入る

Slide 29

Slide 29 text

©NAVITIME JAPAN 差が出ることで起きるデメリット ● 不確実なRollbackとなってしまう ○ AWS側でリビジョンを適用した履歴が残らない ○ gitリポジトリのmasterを現在の状態と同期させておく必要がある ● 新しくProvisionした際に古い状態になってしまう ○ 大障害の際に新しく別のリージョンでProvisionする状況 Revision: 43 Revision: 44 Revision: 45 登録した順番にタスク定義が保存される 44 -> 43 -> 45 の順番に適用した場合に直前に適用したものが「43」と分からない

Slide 30

Slide 30 text

©NAVITIME JAPAN デプロイフローの変更により解決変更前のデプロイフロー

Slide 31

Slide 31 text

©NAVITIME JAPAN デプロイフローの変更により解決変更後のデプロイフロー環境とリポジトリの差分を検出してAlertを飛ばす Pull Request

Slide 32

Slide 32 text

©NAVITIME JAPAN デプロイフロー変更による恩恵 ● どの状態にRollbackするかが明確 ● プルリクエストを介して実稼働する環境を変更する ○ Weaveworksのブログ ■ https://www.weave.works/blog/gitops-operations-by-pull-request ○ そのデプロイに関する関係者を明確にできる ● Single Source of Truth の実現真実はいつもひとつ

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

©NAVITIME JAPAN 監視しなくてはいけないもの ● コンテナ ○ リソース(CPU/メモリ)の使用状況 ○ 起動している数 ● インスタンス(ノード) ● ロードバランサ ○ HTTPステータスコード ● アプリケーションここに落とし穴マネージドサービスを使っているが故の見落としが発生してしまう

Slide 36

Slide 36 text

©NAVITIME JAPAN ある日のGoogle Kubernetes Engine デプロイのジョブが失敗調査しようとkubectlを打つも失敗　 ※ kubectlはk8sを操作するためのコマンドライン $ kubectl get pods Error from server (InternalError): an error on the server ("service unavailable") has prevented the request from succeeding 認証が上手くいっていない？ CLIのversionが古い？どちらも違いそう…

Slide 37

Slide 37 text

©NAVITIME JAPAN ある日のGoogle Kubernetes Engine kubectlをデバッグモードで打ってみる殆どのコマンド発行時にアクセスしている APIのエンドポイントが503になっているらしい… -> kube-systemの一つmetrics-serverが死んでいる ※ kube-systemはGCP側が作成するKubernetesを動かすための　コンテナ群のことです $ kubectl --v=8 get pods cached_discovery.go:79] skipped caching discovery info due to an error on the server ("service unavailable") has prevented the request from succeeding..... https://xx.xx.xx.xx/apis/metrics.k8s.io/v1beta1

Slide 38

Slide 38 text

©NAVITIME JAPAN 原因 GCP側がkube-systemのコンテナ群をアップデートした際に失敗していた原因はこちらにあり、気づかなければいけなかった GCPが監視すべきもの NAVITIMEが監視するべきもの誰も見れていない部分

Slide 39

Slide 39 text

©NAVITIME JAPAN 原因 GCP側がkube-systemのコンテナ郡をアップデートした際に失敗していた原因はこちらにあり、気づかなければいけなかった GCPが監視すべきもの NAVITIMEが監視するべきもの誰も見れていない部分 Kubernetes自体の健康状態も監視するべきだった

Slide 40

Slide 40 text

Slide 41

Slide 41 text

Slide 42

Slide 42 text

©NAVITIME JAPAN コンテナ用に監視ツールを入れたが課題 Prometheus / Grafana というコンテナの監視を行うためのデファクトのツールを導入したが、現状は下記のようになってしまっている監視ツールの存在・使い方を一部の人間しか知らない ○ SlackにAlertの通知が来ても特定の人がメトリクスを見て判断する形になっている ○ ダッシュボード作成も運用者目線となってしまっている

Slide 43

Slide 43 text

Slide 44

Slide 44 text

©NAVITIME JAPAN どうやって監視の民主化を行うかもうひとりの登壇者：望月さんのいる開発チーム ● PrometheusとGrafanaを導入してアプリケーションに最適化したダッシュボード / アラートを行っていた ● 本来、カスタマイズして様々なメトリクスが取得できるツールを存分に活かしていた（監視に対して非常に前向きで楽しんでいる）開発者に監視ツールのメリットを伝え、そのメリットをかんたんに実現できるような仕組みをつくることでスキルとしての監視を実現できるのではないか