プロダクトの成長に伴うAWSの利用サービスとアーキテクチャの変遷
by
Tomoki Kawajiri
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
プロダクトの成長に伴うAWSの 利用サービスとアーキテクチャの変遷 株式会社おてつたび 川尻智樹
Slide 2
Slide 2 text
株式会社おてつたび リードエンジニア 川尻 智樹 前職の楽天のアクセラレーションプログラムを きっかけに代表の永岡と出会い、創業当初から プロダクト開発全般に携わる。 現在は Rails と React、楽天時代はバックエンド メインで Java や Python で開発
Slide 3
Slide 3 text
Our Vision 日本各地にある本当にいい人、いいもの、い い地域がしっかり評価される世界を創る
Slide 4
Slide 4 text
短期的・季節的な人手不足で困っている地域の方々と、地域に 興味がある方が出会えるマッチングプラットフォーム おてつたび 登録ユーザー数は2.3万人、 受入先は全国47都道府県 700事業者に拡大
Slide 5
Slide 5 text
サービス規模拡大の中での取り組み アクセス数増加への 対応 スケーリング パフォーマンス向上 コストの最適化 プロダクト規模拡大 によるボトルネック の解消 利用サービスの増加で 上がったコストの最適 化
Slide 6
Slide 6 text
インスタンスのオートスケーリング プロダクトローンチ 〜 オートスケーリングの導入
Slide 7
Slide 7 text
プロダクトローンチ EC2 x 2 と RDS の構成 ● ALB と EC2 x 2 のターゲットグ ループ ● ALB には AWS Certificate Manager が発行した証明書を バインド
Slide 8
Slide 8 text
● EC2 インスタンスは 2 台 ○ 負荷分散とリスクヘッジのため ● データベースは RDS を利用 ○ データは一番の資産なので(当たり前ですが)バックアップも可能な RDS でデータ管理 ● CloudFront でコンテンツ配信 ○ CDN による高速配信に加え、アクセスの分散にもつながる
Slide 9
Slide 9 text
運用を開始してから見えてきた課題 ● 突発的なアクセス増加への対応 ○ TV放映など、メディア露出した時のアクセス数の増加にも耐えうる 体制の構築 ● プロダクト規模への対応 ○ プロダクトの数が増えたこと、プロダクトの規模が大きくなるにつれ EC2 インスタンスの負荷が高まる
Slide 10
Slide 10 text
EC2 オートスケーリング ● EC2 インスタンスを自動的に追加または削除 することができる ○ 指定の時間にスケジューリングすることで 予期されるアクセス数増加への体制の構 築 ○ 条件を指定することで一時的な増加にも 対応できる 出典:Amazon EC2 Auto Scaling(需要に合わせてコンピューティング 性能を拡張)| AWS
Slide 11
Slide 11 text
Application Load Balancer 出典:Application Load Balancer とは? - Elastic Load Balancing トラフィックを複数のターゲットに分散させる ● Listener ごとにルールを指定して アクセスを分散 ● ヘルスチェックで有効なインスタン スへアクセスする ● モニタリングでトラフィックやインス タンスの状態を監視
Slide 12
Slide 12 text
No content
Slide 13
Slide 13 text
パフォーマンスの向上 ボトルネックの解消への取り組み
Slide 14
Slide 14 text
背景 ● DB のパフォーマンス悪化 ○ クエリの数が増えることで CPU 使用率が高まり、アクセススピード が悪化 ● 他のプロダクトも影響を受ける ○ DB の負荷が高まることで他のプロダクトのパフォーマンスも同時に 悪化
Slide 15
Slide 15 text
取り組み 1 - リードレプリカ プライマリと読み取り専用のレプリカ インスタンスに分ける 出典:Amazon RDS リードレプリカ | クラウドリレーショナルデータベー ス | アマゾン ウェブ サービス ● 読み取りのクエリ(SELECT 文)はレプリ カに投げることでプライマリのパフォー マンスと耐久性向上 ● レプリカを増やすことで他プロダクトが 影響を受けなくなる
Slide 16
Slide 16 text
取り組み 2 - ElastiCache でデータキャッシュ フルマネージドのインメモリキャッシングサービス Redis にデータをキャッシュして DB の負荷軽減とパフォーマンスの向上 ● マスターデータなど変更性が低いレコードや取得回数が多いレ コードを一定時間キャッシュ ○ DB へのアクセスがなくなり負荷軽減 ○ データを早く取得できるので、アプリケーションのパフォー マンスも向上
Slide 17
Slide 17 text
取り組み 2 - ElastiCache Redis ● プライマリと読み取り専用のレプリカのエンドポイントを使い分ける ○ 読み取りが多い場合にレプリカを分散させることで負荷を軽減できる 出典:Replication: Redis (Cluster Mode Disabled) vs. Redis (Cluster Mode Enabled) - Amazon ElastiCache for Redis
Slide 18
Slide 18 text
取り組み 3 - ALB ターゲットグループを複数管理 出典:Elastic Load Balancing(複数のターゲットにわたる着信トラフィックの分 配)| AWS アプリケーションへのトラフィックを複数のターゲットに分けることでアクセスの負荷分散 ● グループを増やすことでアクセス を分散 ● パスベースのルーティングで特定 のアクセスのみ分けることが可能
Slide 19
Slide 19 text
コスト最適化 利用サービスやインスタンスが増えたことで 上がったコストの最適化 RDS ElastiCache EC2 インスタンス
Slide 20
Slide 20 text
EC2 リザーブドインスタンス インスタンスタイプ(t3.medium など)とインスタンス数、期間を指定して購入すると、期 間内は料金がオンデマンドインスタンスに比べて最大 72 % も安く利用できる ● 踏み台サーバーや Cron Job 実行のサーバーなど、インスタンスタイプが固定で必 要なインスタンス用に購入すると良い ○ アクセスの大幅な増減があまり発生しないプロダクトのインスタンスに使用す ることもおすすめ
Slide 21
Slide 21 text
EC2 スポットインスタンス AWS クラウド内で使用されていない EC2 キャパシティーを利用して、インスタンスを起 動する。オンデマンド料金に比べ最大 90 %割引 需要と供給の変動で利用できるキャパシティーも変わるので、キャパシティーがなくなる と突然インスタンスは終了する 終了した場合の対応を構築することで運用は可能 出典:Amazon EC2 だけじゃない⼊ 最⼊のコス ト効率を⼊に⼊れるための スポットインスタンス 使いこなし術
Slide 22
Slide 22 text
EC2 のインスタンスサイズの調整 インスタンスサイズが異なる複数グループを使用することで料金を抑える。 例えば、small サイズのインスタンスのターゲットグループで通常時は運用して、アクセ スが増えるタイミングで medium サイズのグループに切り替えてトラフィックを受けること で、コストを必要最小限に抑えることができる。
Slide 23
Slide 23 text
EC2 のインスタンスサイズの最適化 モニタリングでトラフィック数や CPU 使用率を参考にすることもできるが、 Jmeter などを使用して負荷テストを行い、限界値を知ることで最適なサイズを知る必要 がある アプリケーション規模が大きくなるとトラフィックは同じでも、インスタンスのメモリや CPU 使用率は高まるので、アプリケーションが起動した状態での限界を知ることがベスト
Slide 24
Slide 24 text
RDS インスタンスサイズの調整 リードレプリカのインスタンスサイズも必要なタイミングで切り替えることでコストを抑え る。
Slide 25
Slide 25 text
RDS リードレプリカの分散 読み込み要求を複数の Amazon RDS リードレプリカに分散させる方 法を教えてください。 Route53 に CNAME で加重レコードを登録して、指定のレプリカへ転送することで複数 のレプリカへ分散させる
Slide 26
Slide 26 text
No content
Slide 27
Slide 27 text
まとめ EC2 ● EC2 オートスケーリングでインスタンスの自動調整 ○ 条件を登録して自動化 ○ スケジューリングで予期されるトラフィック増加へ対応する ● ALB でトラフィックの分散 ○ ターゲットグループの切り替えでインスタンスサイズの調整 ○ モニタリングで状況把握
Slide 28
Slide 28 text
まとめ RDS ● RDS リードレプリカで負荷分散 ● Route 53 に CNAME で加重レコードを登録することで複数のレプリカを利用 ElastiCache ● キャッシュすることで DB への負荷軽減 ● アプリケーションのパフォーマンスの加速 ● レプリカによる負荷分散
Slide 29
Slide 29 text
おすすめ ● テクニカルサポート ○ 設定の方法から課題のソリューション提案まで、幅広いサポートをもら えるので、積極的に利用することをおすすめします ● スタートアップ支援プログラム ○ スタートアップ企業への補助プログラムもあるので、申請することをお すすめします ○ クレジットの範囲内で利用料が割引
Slide 30
Slide 30 text
今後の取り組み
Slide 31
Slide 31 text
コンテナ化 Elastic Container Registry(ECR) と Elastic Container Service(ECS) でコン テナを使用したアプリケーション起動 ● ECR にイメージ(ソースコード)を プッシュ ● ECS が ECR からプルしてアプリ ケーションを起動
Slide 32
Slide 32 text
コンテナ化のメリット 運用工数・コストの削減とスピードアップ ● デプロイスピードの向上 ● コンテナでカプセル化されるので、OS や言語などのバージョンアップ 対応の工数を削減 ● 環境要因によるトラブル削減
Slide 33
Slide 33 text
インスタンス変更の自動化 Amazon CLI を使用した自動化。Lambda で実行することも可能 ちょっとした対応の積み重ねもコストになるので、自動化することで効率化 できる ● ALB ターゲットグループの切り替え ● RDS リードレプリカの作成と削除 などなど
Slide 34
Slide 34 text
エンジニアを募集しています おてつたびでは、新しい旅の形を一緒に作っていく仲間を募集中です! まずはカジュアルにお話ししましょう! ● iOS アプリエンジニア ● Webフルスタックエンジニア Wantedly 会社概要 Meety
Slide 35
Slide 35 text
テックブログと SNS の紹介 Zenn Twitter @tomoki_kawajiri 開発チームでテックブログの発信を行っています。 興味ある方は是非フォローお願いします!