ETL処理をServerlessにしてみた件

by Recruit Technologies

Slide 1

Slide 1 text

2019年03月20日(水) 株式会社リクルートテクノロジーズ日比野恒 ETL処理をServerlessにしてみた件【JAWS-UGコンテナ支部#14】

Slide 2

Slide 2 text

2 名前: 日比野恒 (ひびのひさし) 所属: 株式会社リクルートテクノロジーズ ITソリューション本部サイバーセキュリティ部 (CISSP、CISA、情報処理安全確保支援士) 志向: オープンSIEM構想を推進オープンな技術オープンな環境 × 「オープンな技術」や「オープンな環境」でSIEMを作りたい！！「個人の知見やスキルは、社会の利益のために使われるべき」というマインド自己紹介後日スライド公開予定

Slide 3

Slide 3 text

3 本日のテーマ

Slide 4

Slide 4 text

4 これじゃないよ！

Slide 5

Slide 5 text

Queuing 5 大規模なセキュリティログ分析プラットフォーム Data Enrichment Data Collector Data Store Data Analyze Container Task (ETL) オンプレログ処理サーバ (Shipper) SFPログ各種ログ Security Analysts ログ処理サーバ (Shipper) SFPログイベントログ AWS Region Data Lake Log A Log Z ・・・・・・ Container Task (ETL) Container Task (Collector) ・・・ Container Task (Collector) AWS Cloud Data Archive Instances (Data Store) Instances (BI/Search) CI/CD Stream A Stream Z ・・・

Slide 6

Slide 6 text

動的なエンリッチ 6 ログと一言で言っても色々あるよね定型非定型長期短期監視業務 (SIEM) 監査業務 (Reporting) フォレンジック調査業務ハンティング業務柔軟なサブクエリリアルタイム性多様な検知ロジック高速な集計処理迅速なリストア

Slide 7

Slide 7 text

7 ETL処理とは... DWH ETL Collector Log Log Log Data Lake Log UseCase1 UseCase2 UseCase3 Extract Transform Load

Slide 8

Slide 8 text

8 ElasticStack on AWSで組んでみた Elastic search Logstash Logstash Log Log Log S3 Log UseCase1 UseCase2 UseCase3 Extract Transform Load

Slide 9

Slide 9 text

9 ボトルネックになるのは Elastic search Logstash Logstash Log Log Log S3 Log UseCase1 UseCase2 UseCase3 Extract Transform Load 複雑な処理になるほどCPUがきつい

Slide 10

Slide 10 text

10 やっぱし、スケールさせないとね！ん！？

Slide 11

Slide 11 text

11 ということで、そろそろ本題！

Slide 12

Slide 12 text

12 ×

Slide 13

Slide 13 text

Lostash(ノード) 13 まずはシンプルに... input Firewall IDS/IPS WAF if 分岐 if 分岐 filter output filter処理1 filter処理2 filter処理3 filter処理1 filter処理2 filter処理3 Firewall ID/IPS filter処理1 filter処理2 WAF Elasticsearch filter { if "firewall" in [tags] { grok { match => { "message" => ... } date { match => ... } } if "ids" in [tags] { grok { match => { "message" => ... } date { match => ... } } ・・・ logstash.confの例

Slide 14

Slide 14 text

Lostash(ノード) 14 Multi pipeline機能を使ってみる input Firewall IDS/IPS WAF filter output filter処理1 filter処理2 filter処理3 filter処理1 filter処理2 Elasticsearch input input output output filter filter filter処理1 filter処理2 filter処理3 - pipeline.id: firewall pipeline.batch.size: 125 path.config: "/etc/logstash/conf.d/firewall.conf" pipeline.workers: 1 - pipeline.id: ids pipeline.batch.size: 125 path.config: "/etc/logstash/conf.d/ids.conf" pipeline.workers: 1 - pipeline.id: waf pipeline.batch.size: 125 path.config: "/etc/logstash/conf.d/waf.conf" pipeline.workers: 1 pipeline.ymlの例 id: firewall id: ids id: waf

Slide 15

Slide 15 text

15 Fargateにすることでスケールを手に入れる Images タスク(Logstash) input filter1 filter2 filter3 output サービス: Firewall タスク(Logstash) input filter1 filter2 filter3 output サービス2: IDS タスク(Logstash) input filter1 filter2 filter3 output サービス3: WAF タスク定義タスク定義タスク定義 Fargate 設定ファイル設定ファイル設定ファイル ①ぷっしゅ ②さくせい ③きどう ④よみこみ ⑤とりこみ Elasticsearch Firewall IDS/IPS WAF

Slide 16

Slide 16 text

Logstash 16 世の中そう簡単にはいかないらしい(;´Д｀) ログ保存先 (S3) Backup先 (S3) input s3 メモリキュー EVENT EVENT filter ファイル処理オブジェクトリスト (key名で昇順ソート) ログ処理オブジェクトファイル /tmp/logstash オブジェクトコピー処理オブジェクト削除処理ローカルファイル削除処理 ①オブジェクトリスト生成 ②オブジェクトリスト単位でダウンロード ③イベント格納 ④s3.copy_object ⑤オブジェクト削除 AWS API (COPY) オブジェクトリスト毎にログ処理実行 ⑥ローカルファイル削除 ※②失敗時も実行 Fargateのタスク並列処理で一番最初に処理が完了したLogstash以外はローカルが削除されずに蓄積されてしまう (並列処理を前提にした作りではない...)

Slide 17

Slide 17 text

17 並列分散しても同じ処理の重複がはげしかった Logstashタスク1 filter1 Elasticsearch filter2 filter3 filter4 output Logstashタスク2 filter1 filter2 filter3 filter4 output Logstashタスクxxx filter1 filter2 filter3 filter4 output ・・・ CPU使用率取り込むファイルサイズを小さくしても、Logstashのポーリング間隔次第で多くのログデータにおいて重複処理してしまい、無駄なログのDDoS攻撃状態... ログDDoS攻撃(笑) 重複処理ログ (10MB)

Slide 18

Slide 18 text

Logstash タスクストレージ (10GB) 18 さらにストレージにWriteしてしまっているのも良くないログ保存先 (S3) input s3 メモリキュー EVENT EVENT filter オブジェクトファイル /tmp/logstash Elasticsearch output elasticsearch Dead Letter Que ファイル /var/lib/logstash/dlq Write/Read Write

Slide 19

Slide 19 text

19 【参考】Fargateのタスク制約 No CPU メモリストレージ 1 0.25 vCPU 0.5GB、1GB、および2GB 10GBのDockerレイヤーストレージボリュームマウント用にさらに4GB 2 0.5 vCPU 1GB～4GB(1GB単位) 3 1 vCPU 2GB～8GB(1GB単位) 4 2 vCPU 4GB～16GB(1GB単位) 5 4 vCPU 8GB～30GB(1GB単位) 参考1: AWS Fargateの料金 https://aws.amazon.com/jp/fargate/pricing/ 参考2: Fargateタスクストレージ https://docs.aws.amazon.com/ja_jp/AmazonECS/latest/developerguide/fargate-task-storage.html

Slide 20

Slide 20 text

20 ElasticStack on AWSだとこうなるのか... Kinesis Elasticsearch (3ヶ月) Fargate (Back) Fargate (Front) 生ログ NLB S3 Bucket (Data Lake) リスナ Filebeat Logstash Logstash Index オンプレ環境 AWS環境加工処理 Index’ ③ S3 Bucket (12ヶ月) Snapshot Security Analysts Kibana 生ログ Filebeat 加工処理エンリッチ処理生ログ Filebeat Dead Letter Que Logstash (EC2) ② ① エンリッチ処理 Prefix 【凡例】 Curator Elasticsearch (フォレンジック用) Index’ Curator Kibana Daily Daily インシデント対応時 Logstash (EC2) Lookup DB Stream Kinesis Data Streamsを利用して ETL処理を行うFargate(Logstash)のリソースを無駄なくスケールさせる。

Slide 21

Slide 21 text

21 まとめ ✓ EC2の管理不要で嬉しい！でも、4vCPUだとつらたん(*´ω｀) ✓ S3-input-pluginとFargateとの相性があまり良くなかった... ✓ 次回はAmazon EKSを評価してみるべし！

Slide 22

Slide 22 text

ご清聴ありがとうございました