Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GCP無料枠を使ってデータ分析基盤を作ってみた
Search
Wataru Nishiyama
September 29, 2018
0
1k
GCP無料枠を使ってデータ分析基盤を作ってみた
Wataru Nishiyama
September 29, 2018
Tweet
Share
More Decks by Wataru Nishiyama
See All by Wataru Nishiyama
AWSセキュリティガードレールにより開発者がセキュリティ監視するようになったDMM_課題と今後.pptx.pdf
runble1
0
93
DMMでAWSセキュリティガードレールを作ったので、開発者がAWSセキュリティをチェックする文化を広げていきたい
runble1
7
7.2k
DMMにおける300アカウント67チームのAWSセキュリティを「開発者」に監視してもらうまでの道のり
runble1
1
1k
英語できないエンジニア Google I/O にいく
runble1
0
340
Featured
See All Featured
How to Ace a Technical Interview
jacobian
272
22k
Code Review Best Practice
trishagee
54
15k
The Cost Of JavaScript in 2023
addyosmani
13
3.7k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
225
51k
RailsConf 2023
tenderlove
0
500
Why Our Code Smells
bkeepers
PRO
330
56k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
18
1.8k
Fashionably flexible responsive web design (full day workshop)
malarkey
397
65k
Testing 201, or: Great Expectations
jmmastey
27
6.3k
A Philosophy of Restraint
colly
195
15k
Typedesign – Prime Four
hannesfritz
36
2k
Music & Morning Musume
bryan
39
5.4k
Transcript
GCP無料枠を使って データ分析基盤を作ってみた Wataru Nishiyama
• Wataru Nishiyama • Twitter : @runble1 • ブログ :
https://runble1.com • ハニーポット歴?1ヶ月 自己紹介
俺たちハニー・ポッターが 作らないといけないものは2つ
ハニーポットとデータ分析基盤
データ分析基盤?
ハニーポットで取得したログ を貯めて分析できるところ
データ分析基盤作る意味ある? メリット • 分析しやすい • 自動化しやすい デメリット • 作るのめんどい •
お金かかる
データ分析基盤候補 ▪ハニーポットサーバ上でコマンドラインを使って
データ分析基盤候補 ▪ハニーポットサーバ上でコマンドラインを使って ▪ElasticSearch + Kibana
データ分析基盤候補 ▪ハニーポットサーバ上でコマンドラインを使って ▪ElasticSearch + Kibana ▪Google Cloud Platform
データ分析基盤候補 ▪ハニーポットサーバ上でコマンドラインを使って ▪ElasticSearch + Kibana ▪Google Cloud Platform ← 今回これ
Google Cloud Platform(GCP) で作ってみたよ
なぜGCP?
無料枠が大きい!
最終的にはこんな感じのものができる1
最終的にはこんな感じのものができる2
登場人物紹介
GCE Google Compute Engine 無料枠:f1-micro(vCPU1, メモリ0.6G, HDD30G) ハニーポットも動かせる nginx +
php-fpm + MySQL で WordPress も動かせる
Stackdriver Logging GCP で実行されるアプリケーションのログを取得 ※Stackdriver Monitoring というサービスとは別 無料枠:30日間保存されるログサイズ 50 GBまで
GCEのログを取得してくれる
BigQuery スケーラブルなストレージ + SQLエンジンを備えた DWH 無料枠:ログ保存10GB、クエリ使用量1TB/月 ログは保存期間を設定できる クエリ実行速度はある意味早く、ある意味遅い
Google Data Studio 簡易ダッシュボード作れる 無料 アラートは無理 タグクラウドも作れない
Google Apps Script + Spreadsheet グラフを作れる Slack に送信できる アラートを送信できる 無料
構成図 Compute Engine Stackdriver Logging BigQuery Google Data Studio Google
Apps Script Slack Google Cloud
基盤感想 費用は0円、それでも怖い人はお支払い設定を BigQuery, DataStudio, AppsScript が使いこなせてない 一人 SOC でテンション上がる
ちなみに白状すると
今回基盤に入れたログは ブログ(WordPress)のログ
(ハニーポッター交流会だよね?)
ログが違う
ハニーポットと違って ほとんど攻撃じゃない
攻撃のログを 見つけないといけない!
たくさんのログの中から! ※大したアクセス数じゃないけど
分析基盤が役に立つぜ!
今後の展望 • どんなダッシュボードを作るべきか • どんなグラフを Slack へ送るべきか • セキュリティログ分析(統計解析・機械学習) •
BigQuery ML で機械学習モデリング • データパイプラインを利用したリアルタイム分析 • etc...
おしまい