Upgrade to Pro — share decks privately, control downloads, hide ads and more …

サーバーレスなメール送信システムをAWS CDKで構築し数千人規模の環境で運用した話 / aws dev day cdk mail

k.goto
November 09, 2022

サーバーレスなメール送信システムをAWS CDKで構築し数千人規模の環境で運用した話 / aws dev day cdk mail

AWS Dev Day 2022 Japan登壇資料です。

k.goto

November 09, 2022
Tweet

More Decks by k.goto

Other Decks in Programming

Transcript

  1. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved. サーバーレスなメール送信システムを AWS CDKで構築し数千⼈規模の環境で運⽤した話 後藤 健太 2 0 2 2 . 1 1 . 0 8 - 1 0 A W S D E V D A Y J A P A N C - 5 - 1
  2. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. ⾃⼰紹介 •後藤 健太 § テックリード § 365歩のテック(テックブログ) § ラーメンライター § Twitter: @365_step_tech
  3. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アジェンダ •システム要件 (メール送信システム) •アーキテクチャ •運⽤してみた結果
  4. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved. システム要件 (メール送信システム)
  5. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. システム要件(メール送信システム) •添付ファイルあり •メールはキューイングし、送信失敗時にリトライもしたい •AWSで構築されたバックエンドからアクセスしたい § APIとしての公開でなくてもいい •いい感じにスケールしてほしい サーバーレスでいってみよう︕
  6. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved. アーキテクチャ
  7. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ Amazon Simple Notification Service (Amazon SNS) Amazon Simple Queue Service (Amazon SQS) Amazon DynamoDB AWS Cloud Development Kit (AWS CDK) Amazon Simple Storage Service (Amazon S3) Amazon Simple Email Service (Amazon SES) AWS Lambda Amazon CloudWatch Alarm AWS Chatbot Amazon Simple Queue Service (Amazon SQS) Backend Service End Users send messages for mails upload attached files for mails get attached files for mails batch response for failures lock for deduplication send mails send to DLQ trigger alarm notice
  8. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ • ①AWS Cloud Development Kit (AWS CDK)(TypeScript) • ②Amazon Simple Queue Service (Amazon SQS) • ③Amazon Simple Storage Service (Amazon S3) • ④Amazon DynamoDB • ⑤AWS Lambda(TypeScript) • ⑥Amazon Simple Email Service (Amazon SES) • ⑦監視リソース § Amazon SQS(Dead Letter Queue) § Amazon CloudWatch Alarm § Amazon Simple Notification Service (Amazon SNS) § AWS Chatbot
  9. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •① AWS CDK § 外部パラメータ⽤コンフィグ(TS)ファイル – TypeScriptの型保証 – Zodでバリデーション § ※このネタだけでブログ記事書きました – 「CDKの外部パラメータに型だけでなく制約もかける」 Ø https://go-to-k.hatenablog.com/entry/cdk-parameter-type-validation ①
  10. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •② Amazon SQS § 標準キュー – LambdaトリガーだとFIFOキューでも重複起動の可能性がある Ø メール送信後何らかのエラーでLambdaが終了した際、SQSにメッセージは残り再度Lambdaが⾛る – 標準キュー+DynamoDBでメール送信の重複排除をすることにした § 部分バッチ応答 – バッチ処理のうち失敗したメッセージだけをリトライできる ② CDK例(SQS) 部分バッチ応答 のLambda例 → →部分バッチ応答
  11. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •③ Amazon S3 § 添付ファイル⽤ – SQSに画像をバイナリで乗せる案もあったが・・・ § SQSのペイロード上限 (256KB)超過を考慮して採⽤ – ※Java⽤のAmazon SQS 拡張クライアントライブラリの話はしません § 添付ファイルの流れ – メールシステム呼び出し側で先にS3に画像をアップロード – 画像のパスをメッセージに含めてSQSに渡す – Lambdaが受け取ったパスをもとにS3に取りにいく – S3上のファイルはライフサイクルで定期削除 ③ CDK例(S3)
  12. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •④ Amazon DynamoDB § メール送信の重複排除⽤ § 条件付き書き込み(ConditionExpression)でロックを表現 – 送信メールごとに⼀意になるキーを定義 (メールID+時刻 など) – 条件付き書き込みが成功した=ロックが確保できたらメールを送信する Ø ロック確保後にメール送信に失敗したらcatch節でロック解放 – 条件付き書き込みに失敗した=ロックが確保できなかったら 既にメールが送信されたものと⾒なしてメールを送信しない § TTL(TimeToLive) – 重複排除⽤のデータは送信後しばらくしたら消えても良い – 指定した期間後にデータが⾃動削除されコスト削減 ④ CDK例(DynamoDB)
  13. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •⑤ AWS Lambda § NodejsFunction (aws-cdk-lib/aws-lambda-nodejs) – esbuild – LambdaとCDKで1つのpackage.jsonを共有できる Ø それぞれで必要な依存関係だけに絞ってバンドルしてくれる – ファイル名のルールによりパスを指定せず⾃動でソースコードファイルを読んでくれる Ø スタックファイル︓mystack.ts Ø Lambdaコードファイル︓mystack.mailer.ts ⑤ CDK例(Lambda)
  14. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •⑥ Amazon SES § 構築はCDKのスコープ外とした – CloudFormationでは作りづらかった(SPFやDMARCなどの設定もある) Ø EmailIdentityなどの設定はあります – なので構築済みの前提とします – スクリプトなどでも作れます § サンドボックス外への移動(=制限解除)を忘れずに – APIスロットルレートなどの緩和がされます – デフォルト(サンドボックス状態) Ø 200 メッセージ/24h, 1 メッセージ/1s ⑥
  15. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. アーキテクチャ •⑦ 監視リソース § Amazon SQS(Dead Letter Queue) § Amazon CloudWatch Alarm § Amazon SNS § AWS Chatbot ⑦ Constructクラス Construct Stack
  16. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved. 運⽤してみた結果
  17. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 •半年間ほど運⽤してみた § 利⽤者数︓8000⼈強 – マイクロサービスとして⼀部のAPIから使⽤される •結局どうだったの︖
  18. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 •累計送信数 § 約30万件 •Error件数 § 約9000件 – ※バウンスは対象外 エラー率︓3% (つまり100件に3件はエラー)
  19. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 えっ・・・ ダメじゃん・・・︖
  20. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 いえ、違うんです︕︕
  21. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 •エラーの内容を⾒てみると・・・ § ほぼ全てAmazon SESのスロットリングエラー – SESレート設定(クォータ)︓秒間20件、24時間5万件 – ⼀度に複数送るユースケースも多いのでエラーは想定済み・必然的 ※SQS部分バッチ応答はエラー発⽣時catch内でthrowせずにreturn(正常終了)するため、 Lambdaのエラーメトリクスにはカウントされない(そのためログから観測しました) § 「ほぼ全て」というのは︖ – 1件のみLambdaの原因不明のタイムアウト(timeout: 15秒) – 残りは全てスロットリングエラー 発⽣したのは必然的なエラーのみ(1件以外)
  22. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 •起きたエラーは再実⾏により、全てメール送信はできていた § SQSの部分バッチ応答によるリトライ § エラーのみを再実⾏し、全て試⾏回数内で送信成功 – maxReceiveCount: 5 実質、送信失敗数は 【0件】︕
  23. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 •運⽤の⼿間 § ほとんど何もしていない – バウンス対策はSESのサプレッションリストが便利 – バウンス率の監視はすべき (CloudWatchで可能) •パフォーマンス § 平均duration (Lambda) : 約300ms (メモリ 512MB) – 1 Lambda実⾏での平均メール送信数は約2件 (設定バッチ数とユースケース次第) § 最⼤ピーク時のメール送信数 : 約3000件/5分 – ※CloudWatchメトリクスの63⽇以前のデータは5分単位の集計になるので実際はもっと狭い期間なはず
  24. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 運⽤してみた結果 •結局どうだったの︖ § 送信失敗なし § サーバーレス・マネージドサービスにより運⽤の⼿間もほぼなし § ⾼スケーラビリティ・⾼コストパフォーマンス – SQS + Lambdaによる⽔平スケーリング – 従量課⾦ •課題 § Amazon SESのレート制限の緩和申請してみる︖ § SQS->Lambdaのバッチ数(同時起動数)を減らしてみる︖ § Lambdaのタイムアウト調査・監視
  25. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved. まとめ
  26. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. まとめ •メール送信システムを構築 § フルサーバーレス § AWS CDK •数千⼈規模の環境で半年間運⽤ § 送信失敗なし § 運⽤の⼿間ほぼなし § ⾼スケーラビリティ § ⾼コストパフォーマンス
  27. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 参考 •ブログ記事(365歩のテック) § 「サーバーレスでスケールするメール送信システムをAWS CDKで構築する」 – https://go-to-k.hatenablog.com/entry/mail-queues § 「CDKの外部パラメータに型だけでなく制約もかける」 – https://go-to-k.hatenablog.com/entry/cdk-parameter-type-validation •GitHub § go-to-k/mail-queues – https://github.com/go-to-k/mail-queues
  28. © 2022, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Thank you! © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved. 後藤 健太 Twitter: @365_step_tech