経路探索をスケールさせるクラウドネイティブなインフラへ

©NAVITIME JAPAN 経路探索をスケールさせるクラウドネイティブなインフラへ株式会社ナビタイムジャパン ACTS(研究開発)インフラグループ MicroudPJ　清水健司 2019/9/20

©NAVITIME JAPAN 自己紹介清水健司 • クラウド移行メインのインフラエンジニア • Docker/Kubernetes/Spinnaker
• たまにJavaとGo • AWS認定SAアソシエイト • 筆圧強め

©NAVITIME JAPAN なぜコンテナという技術選択に至ったか

©NAVITIME JAPAN NAVITIMEのサービス概要 Our Products 公共交通ドライブツーリング外国人＆海外トラベル
＆フィットネス PC / SPブラウザ NAVITIME 乗換NAVITIME バスNAVITIME こみれぽドライブサポーターカーナビタイムトラックカーナビツーリングサポーター自転車NAVITIME NAVITIME for Japan Travel NAVITIME Transit NAVITIME Travel ALKOO PLAT

©NAVITIME JAPAN NAVITIMEのサービス概要 Our Products ビジネスナビタイム動態管理ソリューションビジネスナビタイム交通費精算パッケージ広告
/ アライアンスオウンドメディア交通コンサルティング電鉄・バス事業者向けソリューション API / SDK テレマティクスサービス

©NAVITIME JAPAN NAVITIMEの特徴移動の需要によってサーバの負荷が大きく変動 • 通勤時間帯 ◦ 出勤 / 退勤時にアクセスのピーク

©NAVITIME JAPAN NAVITIMEの特徴移動の需要によってサーバの負荷が大きく変動 • GWや長期休暇 ◦ カーナビサービスはアクセス増 • 豪雨などの災害
◦ 乗換アプリなどのアクセス急増 • テレビ広告 ◦ オウンドメディアへのスパイクアクセス

©NAVITIME JAPAN NAVITIMEの特徴コア技術を生かした幅広いサービス展開 • 事業毎に共通のAPIサーバ ◦ 中身は同じだが運用のしやすさや障害時の影響を考え別のサーバグループとしている共通APIサーバ
載っているプロダクトは同じ

©NAVITIME JAPAN NAVITIMEの特徴コア技術を生かした幅広いサービス展開 • スピード感を持った事業展開 ◦ BtoC：アイデアを実現させた新機能やサービス ◦ BtoB：案件ベースで新サービスのローンチ

©NAVITIME JAPAN オンプレ運用時の苦しいところ • スケールできない ◦ 予想できる高トラフィックは前もって増設ができるが、予期できない場合は現状のサーバで捌くしかない ◦ 前もって増設するのも運用コストがかかる
• サービス展開までのリードタイム ◦ 新しくサーバを調達するのに時間がかかるため、新規サービス立ち上げに時間がかかる

©NAVITIME JAPAN オンプレ運用時の苦しいところ • スケールできない ◦ 予想できる高トラフィックは前もって増設ができるが、予期できない場合は現状のサーバで捌くしかない ◦ 前もって増設するのも運用コストがかかる
• サービス展開までのリードタイム ◦ 新しくサーバを調達するのに時間がかかるため、新規サービス立ち上げに時間がかかるこれらを解決するのがクラウド × コンテナでした

©NAVITIME JAPAN なぜコンテナに移行したかクラウドの良さを引き出してくれる • クラウドの場合にVMよりもコンテナの方が運用が楽 • マルチクラウドでの運用を見据えたときに、アプリケーションのポータビリティが非常に強みになる
aws gcp

©NAVITIME JAPAN なぜコンテナに移行したかマネージドサービスが充実している • コンテナオーケストレーションをする際に肝心なマスターノードの管理/冗長化をする必要性がない • クラウドベンダーやOSSコミュニティがものすごい
スピードで機能追加/改善を行っている → 巨人の肩に乗ってモダンな構成を組むことができる

©NAVITIME JAPAN 移行した結果 9月9日台風上陸時の突発的なアクセス増（乗換）アクセス数サーバ台数

©NAVITIME JAPAN オンプレの構成のままクラウドで動かすのは難しい

©NAVITIME JAPAN オンプレの構成のまま持っていけるかオンプレの構成はVM上でアプリケーションを稼働 • コンテナ化は単純にコードに起こすだけではアプリケーションを健全に運用できない 1プロセス = 1コンテナが基本
• オンプレのサーバはstatefulかつmutable クラウドで扱うコンテナはstatelessかつimmutable

©NAVITIME JAPAN オンプレの構成のまま持っていけるかオンプレの構成はVM上でアプリケーションを稼働 • コンテナ化は単純にコードに起こすだけではアプリケーションを健全に運用できない 1プロセス = 1コンテナが基本
• オンプレのサーバはstatefulかつmutable クラウドで扱うコンテナはstatelessかつimmutable A. むずかしい

©NAVITIME JAPAN コンテナ設計のデザインパターンを利用するアプリケーションのコンテナ化 ◦ シングルノードのコンポーネントを別々のコンテナで動かす ◦ コンテナ化のゴールは境界を設けること ◦
どんな境界か ▪ リソースの境界 ▪ チームのオーナーシップの境界 ▪ 関心の分離の境界

©NAVITIME JAPAN サイドカーパターン「メインのコンテナに加えて　補助的な機能を追加するコンテナを内包する」パターン ﬂuentdコンテナにアクセスログとアプリケーションログをオブジェクトストレージに転送する責務を委譲する各コンテナがボリュームを通してファイルを共有できる特徴を生かしている tomcat httpd
fluentd LOG LOG

©NAVITIME JAPAN ステートフルからステートレスへデータ配信方法の最適化 ◦ 地図や時刻表、インデックスデータはインスタンスもしくはコンテナ群の起動時に取得する必要性がある ▪
EC2のユーザデータを使用してEBSをアタッチする ▪ データ取得の責務を担うコンテナを用意するサイドカーパターンを利用する gcloud solr file file file file file SDKを含むコンテナがCloud Storageからインデックスファイル群を取得

©NAVITIME JAPAN 構成を見直し得られたもの • リソースの境界 ◦ ベストエフォートのサービスのコンテナは割当を少なくして、メインのコンテナのレイテンシが他サービスのリソース消費によって増大しないようにできる割当リソース
httpd tomcat fluentd 他... アプリケーションのPFに直結するメインのコンテナ郡ベストエフォート

©NAVITIME JAPAN 構成を見直し得られたもの • チームのオーナーシップの境界 ◦ ﬂuentdコンテナの改善はアプリケーションコンテナを管理するPJ でなく、クラウドインフラを管轄するPJが行うことができている ▪ コンテナが分かれているので所有権が明確
例： • httpdとtomcatは開発チームが改修 • ログ転送エージェントのﬂuentdはインフラが改修 • 場合によってはプルリク or モブで情報共有

©NAVITIME JAPAN クラウド環境に適したデプロイを目指す

©NAVITIME JAPAN Infrastructure as Codeは達成できたか • Dockerで環境構築手順をCode化できた • 複数のコンテナの定義を管理するファイルもちゃんとGitで管理できている
◦ Amazon ECSでのタスク定義 (json) ◦ KubernetesにおけるDeployment (yaml) 達成できた…？

©NAVITIME JAPAN Infrastructure as Codeは達成できたか • Dockerで環境構築手順をCode化できた • 複数のコンテナの定義を管理するファイルもちゃんとGitで管理できている
◦ Amazon ECSでのタスク定義 (json) ◦ KubernetesにおけるDeployment (yaml) 段々とGitリポジトリと実際に動いているものに差が生まれてきてしまった

©NAVITIME JAPAN なぜ差が出来てしまったのか • リリースした後、手でマニフェストに追いつきをかける運用になっていた ◦ この作業が抜けてしまうケースが多かったが、抜けてしまっても問題ない状態となっていることにも原因の一端がある BitBucket
現在動いているタスク定義を取得しタグを書き換えて適用コンテナのタグを指定してジョブ実行

©NAVITIME JAPAN なぜ差が出来てしまったのか • 一部を除いてインフラが手で設定を変更する運用になっていた ◦ インフラエンジニア以外はジョブを通してコンテナのタグ変更のみしか出来ない状態にあったタグ以外はインフラが変更

©NAVITIME JAPAN 差が出ることで起きるデメリット • 定義した項目がAWS側のデフォルト設定なのか意図した設定なのかがコンソールから判断できない "containerDefinitions": [ { "name":
"web", "image": "httpd:hoge", "cpu": 128, "memoryReservation": 450, "links": [ "app:app" ], "containerDefinitions": [ { "dnsSearchDomains": null, "logConfiguration": null, "entryPoint": null, "image": "httpd:hoge", "startTimeout": null, "firelensConfiguration": null, "dependsOn": null, "disableNetworking": null, "interactive": null, "healthCheck": null, "links": [ "app:app" ], 適用するファイル適用後に確認できる画面適用したファイルにタスク定義の全ての項目が追加されデフォルト値が入る

©NAVITIME JAPAN 差が出ることで起きるデメリット • 不確実なRollbackとなってしまう ◦ AWS側でリビジョンを適用した履歴が残らない ◦ gitリポジトリのmasterを現在の状態と同期させておく必要がある •
新しくProvisionした際に古い状態になってしまう ◦ 大障害の際に新しく別のリージョンでProvisionする状況 Revision: 43 Revision: 44 Revision: 45 登録した順番にタスク定義が保存される 44 -> 43 -> 45 の順番に適用した場合に直前に適用したものが「43」と分からない

©NAVITIME JAPAN デプロイフローの変更により解決変更前のデプロイフロー

©NAVITIME JAPAN デプロイフローの変更により解決変更後のデプロイフロー環境とリポジトリの差分を検出してAlertを飛ばす Pull Request

©NAVITIME JAPAN デプロイフロー変更による恩恵 • どの状態にRollbackするかが明確 • プルリクエストを介して実稼働する環境を変更する ◦ Weaveworksのブログ ▪
https://www.weave.works/blog/gitops-operations-by-pull-request ◦ そのデプロイに関する関係者を明確にできる • Single Source of Truth の実現真実はいつもひとつ

©NAVITIME JAPAN 監視しなくてはいけないもの • コンテナ ◦ リソース(CPU/メモリ)の使用状況 ◦ 起動している数 •
インスタンス(ノード) • ロードバランサ ◦ HTTPステータスコード • アプリケーションここに落とし穴マネージドサービスを使っているが故の見落としが発生してしまう

©NAVITIME JAPAN ある日のGoogle Kubernetes Engine デプロイのジョブが失敗調査しようとkubectlを打つも失敗　 ※ kubectlはk8sを操作するためのコマンドライン
$ kubectl get pods Error from server (InternalError): an error on the server ("service unavailable") has prevented the request from succeeding 認証が上手くいっていない？ CLIのversionが古い？どちらも違いそう…

©NAVITIME JAPAN ある日のGoogle Kubernetes Engine kubectlをデバッグモードで打ってみる殆どのコマンド発行時にアクセスしている APIのエンドポイントが503になっているらしい… -> kube-systemの一つmetrics-serverが死んでいる
※ kube-systemはGCP側が作成するKubernetesを動かすための　コンテナ群のことです $ kubectl --v=8 get pods cached_discovery.go:79] skipped caching discovery info due to an error on the server ("service unavailable") has prevented the request from succeeding..... https://xx.xx.xx.xx/apis/metrics.k8s.io/v1beta1

©NAVITIME JAPAN 原因 GCP側がkube-systemのコンテナ群をアップデートした際に失敗していた原因はこちらにあり、気づかなければいけなかった GCPが監視すべきもの NAVITIMEが監視するべきもの誰も見れていない部分

©NAVITIME JAPAN 原因 GCP側がkube-systemのコンテナ郡をアップデートした際に失敗していた原因はこちらにあり、気づかなければいけなかった GCPが監視すべきもの NAVITIMEが監視するべきもの誰も見れていない部分 Kubernetes自体の
健康状態も監視するべきだった

©NAVITIME JAPAN コンテナ用に監視ツールを入れたが課題 Prometheus / Grafana というコンテナの監視を行うためのデファクトのツールを導入したが、現状は下記のようになってしまっている監視ツールの存在・使い方を一部の人間しか知らない
◦ SlackにAlertの通知が来ても特定の人がメトリクスを見て判断する形になっている ◦ ダッシュボード作成も運用者目線となってしまっている

©NAVITIME JAPAN どうやって監視の民主化を行うかもうひとりの登壇者：望月さんのいる開発チーム • PrometheusとGrafanaを導入してアプリケーションに最適化したダッシュボード / アラートを行っていた •
本来、カスタマイズして様々なメトリクスが取得できるツールを存分に活かしていた（監視に対して非常に前向きで楽しんでいる）開発者に監視ツールのメリットを伝え、そのメリットをかんたんに実現できるような仕組みをつくることでスキルとしての監視を実現できるのではないか

経路探索をスケールさせるクラウドネイティブなインフラへ

経路探索をスケールさせるクラウドネイティブなインフラへ

More Decks by NAVITIME JAPAN

Other Decks in Technology

Featured

Transcript