$30 off During Our Annual Pro Sale. View Details »

AWS Startup Tech Meetup #3: かんたんコンテナロギング選手権

AWS Startup Tech Meetup #3: かんたんコンテナロギング選手権

コンテナでログをどう取得すればいいの?そもそもどういうログがあるのか?

ログの取得パターンから活用方法まで、 @prog893 が選定のためのヒントとサンプルアーキテクチャで紹介します。

Tamirlan 893 Torgayev

March 25, 2021
Tweet

More Decks by Tamirlan 893 Torgayev

Other Decks in Technology

Transcript

  1. © 2021, Amazon Web Services, Inc. or its Affiliates.
    Tamirlan Torgayev @prog893
    Startup Solutions Architect
    Amazon Web Services Japan
    2021/03/25
    かんたんコンテナロギング選手権
    AWS Startup Tech Meetup #3

    View Slide

  2. © 2021, Amazon Web Services, Inc. or its Affiliates.
    Tamirlan Torgayev (ティーマ)
    Startup Solutions Architect
    Amazon Web Services Japan
    メガベンチャーグループ企業に新卒入社、
    様々なメディアサービスのインフラを支援
    AWSでスタートアップ支援
    好きなもの: Amazon Kinesis、 Amazon ECS、
    カメラ!、猫"
    @prog893

    View Slide

  3. © 2021, Amazon Web Services, Inc. or its Affiliates.
    本日のアジェンダ
    • ログにまつわるよくある課題
    • ログの種類
    • ログの転送方法
    • 用途ごとに選べる、ログの格納先
    • 最適化後のサンプルアーキテクチャ

    View Slide

  4. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログにまつわるよくある課題

    View Slide

  5. © 2021, Amazon Web Services, Inc. or its Affiliates.
    よくあるコンテナアーキテクチャ
    • コンテナを活用したアーキテクチャを作れた
    • リリースもできて、ビジネスも成長している
    Amazon CloudWatch
    ECS Task
    Application
    Users
    AWS Cloud
    Amazon Aurora
    Application Load
    Balancer
    logs
    user data

    View Slide

  6. © 2021, Amazon Web Services, Inc. or its Affiliates.
    よくあるコンテナアーキテクチャ (Cont.)
    • しかし、ログ周りの構成について考えられていないので、
    問題発生時の調査に困ったり、コストがかかったり
    • とりえあずawslogsでやっている
    • FireLensとか色々あるけどよくわからない
    • fluentdの管理大変
    • stdoutをparseするのもつらい
    • ログ周りを作り込むのに時間をかけられない
    いくつかのログ周りアーキテクチャパターンと選定のヒント、紹介します!

    View Slide

  7. © 2021, Amazon Web Services, Inc. or its Affiliates.
    AWS Fargateのメリットと利用時の課題
    • Fargateを使うことでサーバ管理不要
    • コード、ビジネスに集中できる
    • しかし、observabilityが課題
    • 状況把握のためにログを出力を導入
    • 共有ボリュームの容量が少なくログが吐けない
    • ログ転送のための相乗りを改善したい
    • New: ECS Execでコンテナへのコマンド実行、
    インタラクティブシェルが可能に!

    View Slide

  8. © 2021, Amazon Web Services, Inc. or its Affiliates.
    そもそもログで何をして欲しいのか
    • ログとは
    • アプリケーションでどの時点で何が起きているかを
    把握するための出力情報
    • ログをしっかり、全部とりましょう
    • ログがないと、何かが起きた時に原因調査ができない
    • アプリケーションの現状を把握することも困難
    # 必要なログ、しっかり出力しましょう

    View Slide

  9. © 2021, Amazon Web Services, Inc. or its Affiliates.
    そもそもログで何をして欲しいのか (Cont.)
    • どういうログを取ればいいのか?
    • アプリケーションとその要件による
    • 一般的なログ種類を紹介する
    • ログ転送、保管の方法は?
    • ログの要件によって最適な格納、転送方法が異なる
    # 最適な格納方法、転送方法になっていないと、
    調査が難しく、コストがかかる

    View Slide

  10. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログの種類

    View Slide

  11. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログの種類
    • ログの種類と、それぞれの種類に対する要件を確認しましょう
    • 要件によって、適切な転送方法と格納先が変わリます
    • それぞれの要件に合わせた設計にしましょう
    • 保持期間、スループット、許容欠損率、活用方法、高速アクセス

    View Slide

  12. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログの例
    • Access logs: 1年保持、max 1 Mbps、daily 20GB、簡単な調査
    • nginxログのような、アクセス情報
    • Activity logs: 1年保持、max 1 Mbps、daily 20GB、集約クエリ (BI)
    • ユーザ行動、SNSならいいね、友達申請など
    • Error logs: 3ヶ月保持、max 0.1 Mbps、daily 2GB、高度な調査
    • エラーの概要
    • Trace logs: 1ヶ月保持、max 0.1 Mbps、daily 1GB、閲覧のみ、非構造
    • スタックトレースのようなもの
    • Audit logs: 5年間保持、max 0.1 Mbps、daily 5GB、欠損許容できない
    • 金融サービスなどにおける監査ログ

    View Slide

  13. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログの転送方法

    View Slide

  14. © 2021, Amazon Web Services, Inc. or its Affiliates.
    awslogs logging driver
    Pros:
    • stdoutに出力するだけ
    • 転送ロジックの実装不要
    • 転送のためのリソース不要
    Cons:
    • 高度な処理は難しい
    • ログ種類ごとに異なる場所への
    格納が難しい
    • CloudWatch Logsにしか転送できない
    ! Traceにおすすめ
    ECS Task
    Application
    Docker
    Daemon
    logging
    driver
    Amazon CloudWatch

    View Slide

  15. © 2021, Amazon Web Services, Inc. or its Affiliates.
    fluentd sidecar
    Pros:
    • カスタマイズ性が高い
    • 格納先が選べる
    Cons:
    • コンフィグの管理が必要
    • カスタムプラグインを使いたい場合、
    Docker Imageの管理も
    • 共有ボリュームへのファイル出力が
    必要
    • ログローテーション必要
    in_tailなどのinput pluginがロテーション検知に対応、
    logrotate sidecarを導入することでアプリ変更なしで
    ロテーション対応可能
    ! Access、Activityのような
    大容量ログにおすすめ
    ECS Task
    Application
    File
    output
    fluentd
    tail
    Volume
    Amazon CloudWatch


    View Slide

  16. © 2021, Amazon Web Services, Inc. or its Affiliates.
    FireLens
    Pros:
    • カスタマイズ性が高い
    Cons:
    • コンフィグの管理が必要
    !全ログ種類に使える
    ECS Task
    Application FireLens
    (fluentbit)
    logging
    driver
    Docker
    Daemon
    Amazon CloudWatch


    View Slide

  17. © 2021, Amazon Web Services, Inc. or its Affiliates.
    用途ごとに選べる、
    ログの格納先

    View Slide

  18. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログの格納先と活用方法
    • CloudWatch Logs
    • GUIでログ一覧をみたい
    • 簡易検索、フィルタリング
    • S3
    • 大量のログを安価に保存
    • Athenaを活用することでクエリ可能
    • Elasticsearch
    • Kibanaでの可視化、アラート、高度なクエリ
    • QuickSight
    • エンジニアでない人に提供するBIダッシュボード
    • S3 + AthenaでデータをQuickSightに反映可能
    # 要件に合わせて
    適切な格納先を選定しましょう

    View Slide

  19. © 2021, Amazon Web Services, Inc. or its Affiliates.
    ログの格納先と活用方法 (Cont.)
    • Elasticsearch、3rd party にログを格納するとき、API操作が必要
    • Elasticsearch Bulk APIなど
    • 例えばLambdaを使えば実装できる
    • しかし、リトライ処理、ログが欠損しないための一時的な置き場所を
    どうすれば…

    View Slide

  20. © 2021, Amazon Web Services, Inc. or its Affiliates.
    Kinesis Data Streamsのログへの応用
    • 「保持期間」を活用することでリトライ処理を実装する必要がない
    • 例えば、Lambdaを使う場合、実行が成功するまでリトライされる
    • 低レイテンシー
    • データ収集から活用可能になるまで ~70 ms
    • 高スループット
    • 1時間あたり数TBの処理までスケール可能
    ここでリトライされる
    ECS Task
    Application Kinesis Data
    Streams
    AWS Lambda
    Amazon S3
    Amazon Elasticsearch
    Service

    View Slide

  21. © 2021, Amazon Web Services, Inc. or its Affiliates.
    サンプルアーキテクチャ

    View Slide

  22. © 2021, Amazon Web Services, Inc. or its Affiliates.
    End-to-end logging architecture primer
    ECS Task
    Application FireLens
    (fluentbit)
    logging
    driver
    Kinesis Data
    Streams
    AWS Lambda
    Amazon S3
    Amazon Elasticsearch
    Service
    Amazon CloudWatch
    Amazon QuickSight
    Activity logs
    可視化、BI
    All logs
    Access, error logs
    調査、可視化、アラート
    Trace logs
    Activity logs
    クエリ
    Amazon Athena

    View Slide

  23. © 2021, Amazon Web Services, Inc. or its Affiliates.
    欠損の考え方
    • ログでいうところの可用性は欠損率
    • 可用性とコストのトレードオフ
    • どこまでの欠損率が許容できるのか
    • 例えば、fluentdやfluentbitの急停止によるmemory buffer上のログの
    消失の対策は:
    • awslogs
    • Kinesis Data Streamsへの直接書き込み
    • fluentd/fluentbit → EC2集約サーバ (disk buffer)
    欠損が許容できないなら、DBに書き込んだ方が良いのでは?

    View Slide

  24. © 2021, Amazon Web Services, Inc. or its Affiliates.
    最後に
    • ログの考え方は、コンテナでもそうじゃなくても一緒
    • コンテナではlogging driverなどで、難しく考えられがち
    • ログをどうすればいいのか、ログの要件、転送方法や格納先は変わらない
    • 要件に合わせた、将来性・拡張性のあるアーキテクチャを目指しましょう
    • ビジネスがさらに成長したら、
    アーキテクチャを大きく変えなくてもいいように
    • 溜まったログを活用しましょう
    • パフォーマンス改善、トラブルシュート、BI
    コンテナな人もそうじゃない人も、ログアーキテクチャを最適化しましょう!

    View Slide