Upgrade to Pro — share decks privately, control downloads, hide ads and more …

トレタを支える技術(インフラ編)

 トレタを支える技術(インフラ編)

wind-up-bird

August 02, 2019
Tweet

More Decks by wind-up-bird

Other Decks in Technology

Transcript

  1. インフラの変遷 創業(2013 年) 〜 2015 年 EngineYard, Heroku, AWS, GCP

    ( 主にBQ) 2016 年 EY => AWS へ全面的に移行 2017 年 〜 2018 年 Kubernetes (GKE) の採用 2019 年 〜 Kubernetes (EKS) の採用と移行 5
  2. 利用しているクラウドサービス AWS EC2, Aurora, S3, ELB, SQS, SNS, Route53, Lambda,

    Codebuild, ApiGateway, EKS ... トレタの主要サービス GCP BigQuery, Compute Engine, EKS, CloudFunction, StackDriver, GKE ... データ/ ログ解析, 一部toC 向けサービス, Backup ... Heroku 既存サービス, Feasibility Study ... 8
  3. アーキテクチャ 思想: シンプルで高可用性が設計の基本。 既存サービスA 代表例 LB (ALB, NLB) Nginx (EC2)

    = キャッシュ&R プロキシ Rails (EC2) = アプリケーション Redis (EC2) = Sidekiq 非同期処理 DB (Aurora) = Writer + Reader * 2 10
  4. 開発フロー Github GitFlow による開発 CI/CD 各 Branch への merge による自動化

    CircleCI 2.1 Feature: Build, Test, Dry­Run develop/master: staging/production deploy 13
  5. 開発ツール ( の一部) Packer + Ansible + Serverspec 各システム毎に定義 OS(ubuntu),

    MW(nginx, monit, mackerel­agent), *env, td­agent, Newrelic etc... Terraform 各システム毎に *.tf を定義 NW, LB, EC2 (Target Group, Listener, AutoScaling) etc... RoadWorker 作成したリソースに対して、DNS を設定。 14
  6. 課題 OS まわり EOL => アップデート 各サブシステム毎にそれそれV­UP 大小含め約 10 サービス

    事前検証 + staging でリハーサル + 本番 すべてシステム無停止で実施(済) 今後もアップデートし続けなければならない。 19
  7. EC2 まわり EC2 インスタンスの起動時間 AutoScaling で起動までに7 分 突発的なアクセスだと間に合わない可能性も 特に toC

    向けのサービスではクリティカル XXX on EC2 Managed サービスへの段階的な移行 EY 時代の名残もある。 これも今後移行していく(予定)。 22
  8. DB まわり 肥大化 ユーザ数、システム拡大に伴うトラフィックの増加 [App] switch_point の導入 [Infra] スケールアップで対応 ETL

    の処理時間 10 時間程度かかる 並列度あげる このままだと、いずれ頭打ちとなる可能性 DB の分割などアーキテクチャの見直し 23
  9. やっていきたいこと XXX on EC2 からの脱却 マネージドサービスへの移行を加速 MicroService 化 kubernetes の導入

    Auto Scaling, Auto Healing 障害の局所化 開発速度の向上 DB やそれ以外にも色々。。。 25