Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
GCP無料枠を使って データ分析基盤を作ってみた Wataru Nishiyama
Slide 2
Slide 2 text
● Wataru Nishiyama ● Twitter : @runble1 ● ブログ : https://runble1.com ● ハニーポット歴?1ヶ月 自己紹介
Slide 3
Slide 3 text
俺たちハニー・ポッターが 作らないといけないものは2つ
Slide 4
Slide 4 text
ハニーポットとデータ分析基盤
Slide 5
Slide 5 text
データ分析基盤?
Slide 6
Slide 6 text
ハニーポットで取得したログ を貯めて分析できるところ
Slide 7
Slide 7 text
データ分析基盤作る意味ある? メリット ● 分析しやすい ● 自動化しやすい デメリット ● 作るのめんどい ● お金かかる
Slide 8
Slide 8 text
データ分析基盤候補 ■ハニーポットサーバ上でコマンドラインを使って
Slide 9
Slide 9 text
データ分析基盤候補 ■ハニーポットサーバ上でコマンドラインを使って ■ElasticSearch + Kibana
Slide 10
Slide 10 text
データ分析基盤候補 ■ハニーポットサーバ上でコマンドラインを使って ■ElasticSearch + Kibana ■Google Cloud Platform
Slide 11
Slide 11 text
データ分析基盤候補 ■ハニーポットサーバ上でコマンドラインを使って ■ElasticSearch + Kibana ■Google Cloud Platform ← 今回これ
Slide 12
Slide 12 text
Google Cloud Platform(GCP) で作ってみたよ
Slide 13
Slide 13 text
なぜGCP?
Slide 14
Slide 14 text
無料枠が大きい!
Slide 15
Slide 15 text
最終的にはこんな感じのものができる1
Slide 16
Slide 16 text
最終的にはこんな感じのものができる2
Slide 17
Slide 17 text
登場人物紹介
Slide 18
Slide 18 text
GCE Google Compute Engine 無料枠:f1-micro(vCPU1, メモリ0.6G, HDD30G) ハニーポットも動かせる nginx + php-fpm + MySQL で WordPress も動かせる
Slide 19
Slide 19 text
Stackdriver Logging GCP で実行されるアプリケーションのログを取得 ※Stackdriver Monitoring というサービスとは別 無料枠:30日間保存されるログサイズ 50 GBまで GCEのログを取得してくれる
Slide 20
Slide 20 text
BigQuery スケーラブルなストレージ + SQLエンジンを備えた DWH 無料枠:ログ保存10GB、クエリ使用量1TB/月 ログは保存期間を設定できる クエリ実行速度はある意味早く、ある意味遅い
Slide 21
Slide 21 text
Google Data Studio 簡易ダッシュボード作れる 無料 アラートは無理 タグクラウドも作れない
Slide 22
Slide 22 text
Google Apps Script + Spreadsheet グラフを作れる Slack に送信できる アラートを送信できる 無料
Slide 23
Slide 23 text
構成図 Compute Engine Stackdriver Logging BigQuery Google Data Studio Google Apps Script Slack Google Cloud
Slide 24
Slide 24 text
基盤感想 費用は0円、それでも怖い人はお支払い設定を BigQuery, DataStudio, AppsScript が使いこなせてない 一人 SOC でテンション上がる
Slide 25
Slide 25 text
ちなみに白状すると
Slide 26
Slide 26 text
今回基盤に入れたログは ブログ(WordPress)のログ
Slide 27
Slide 27 text
(ハニーポッター交流会だよね?)
Slide 28
Slide 28 text
ログが違う
Slide 29
Slide 29 text
ハニーポットと違って ほとんど攻撃じゃない
Slide 30
Slide 30 text
攻撃のログを 見つけないといけない!
Slide 31
Slide 31 text
たくさんのログの中から! ※大したアクセス数じゃないけど
Slide 32
Slide 32 text
分析基盤が役に立つぜ!
Slide 33
Slide 33 text
今後の展望 ● どんなダッシュボードを作るべきか ● どんなグラフを Slack へ送るべきか ● セキュリティログ分析(統計解析・機械学習) ● BigQuery ML で機械学習モデリング ● データパイプラインを利用したリアルタイム分析 ● etc...
Slide 34
Slide 34 text
おしまい