Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Googleのデータ解析サービス「BigQuery」の凄さ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Youkey
August 25, 2018
Technology
0
660
Googleのデータ解析サービス「BigQuery」の凄さ
Let`s BBQ
Youkey
August 25, 2018
Tweet
Share
More Decks by Youkey
See All by Youkey
GCPUGOsaka_12.pdf
yukinakata
1
66
GCPUGOsaka_11.pdf
yukinakata
0
250
About Fenrir Inc.
yukinakata
0
73
Alibaba Cloud DataV handson 2019/03/07
yukinakata
0
430
Origin of the Our Service's name.
yukinakata
0
1k
How about the DataWorks(AliCloud) to easily ?
yukinakata
0
370
Report of TCC2018
yukinakata
0
250
TCCtour agenda for AliEatersOsaka
yukinakata
1
350
スマートシティを支えるAlibabaCloudAI
yukinakata
0
290
Other Decks in Technology
See All in Technology
AIが実装する時代、人間は仕様と検証を設計する
gotalab555
1
290
ランサムウェア対策としてのpnpm導入のススメ
ishikawa_satoru
0
220
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
4
220
【Oracle Cloud ウェビナー】[Oracle AI Database + AWS] Oracle Database@AWSで広がるクラウドの新たな選択肢とAI時代のデータ戦略
oracle4engineer
PRO
2
180
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
350
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
220
茨城の思い出を振り返る ~CDKのセキュリティを添えて~ / 20260201 Mitsutoshi Matsuo
shift_evolve
PRO
1
400
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
4
1.4k
Ruby版 JSXのRuxが気になる
sansantech
PRO
0
170
1,000 にも届く AWS Organizations 組織のポリシー運用をちゃんとしたい、という話
kazzpapa3
0
160
Frontier Agents (Kiro autonomous agent / AWS Security Agent / AWS DevOps Agent) の紹介
msysh
3
190
Cosmos World Foundation Model Platform for Physical AI
takmin
0
970
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.6k
The Language of Interfaces
destraynor
162
26k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
120
Testing 201, or: Great Expectations
jmmastey
46
8.1k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
Design in an AI World
tapps
0
150
Tell your own story through comics
letsgokoyo
1
810
Are puppies a ranking factor?
jonoalderson
1
2.7k
How to build a perfect <img>
jonoalderson
1
4.9k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
130
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
58
50k
Transcript
Copyright © 2018 Cavity.LLC All Rights Reserved. Googleのデータ解析サービス 「BigQuery」の凄さ 2018/08/25(sat)
GCPUG Wakayama x Osaka #1
Copyright © 2018 Cavity.LLC All Rights Reserved. Let’s BBQ 2018/08/25(sat)
GCPUG Wakayama x Osaka #1
すみか:ビッグデータ解析のコンサル会社経営(副業) Cavity LLC. Co-Founder (Principal) GCP歴: 1年半(= BQ暦 ) しゅみ:分析解析での失敗
/ アボカド育てて食う Who am I ? 中田 祐樹 / Yuki Nakata ◦ 本業はGMOクラウド(株)のプリセールス ◦ 組込プログラマからSIerでSEを経て、BigQueryにはまる ◦ 計算社会科学が好きだけど、無免許データエンジニア
Copyright © 2018 Cavity.LLC All Rights Reserved. About us ➢
社名 : Cavity合同会社(英:Cavity.LLC) ➢ 本社 : 滋賀県東近江市林町 ➢ 代表社員 : 中田 祐樹(youkey:CEO/CTO)・小野 寛徳(nickson:COO) ➢ 設立 : 平成30年4月20日 ➢ 資本金 : 10円 ➢ 事業内容 : ビッグデータコンサルティング事業 ・ IaaSを用いたデータ活用コンサルティング ・ イベント運営、コミュニティ形成支援 ・ その他上記付帯事業、各種営業代行
Copyright © 2018 Cavity.LLC All Rights Reserved. Mission Statement 企業に眠るデータ資産を 「溜めるだけ」から「価値を生み出すもの」に変換す
る支援を行います。 あらゆる人がデータ活用を「当たり前に」行う社会へ の発展に貢献します。
Copyright © 2018 Cavity.LLC All Rights Reserved. AliEaters Osaka #2
2018/10/04(thu) 19:00 GMO yours大阪支社( B23F ) ・東京や札幌、福岡始まった Alibaba Cloud UGの大阪版 ・CavityはDataVで(大人の事情) ・非エンジニアもOK ・中国市場の話とか満載
Copyright © 2018 Cavity.LLC All Rights Reserved. データ可視化・分析してますか?
Copyright © 2018 Cavity.LLC All Rights Reserved. やりたかった事 非エンジニアが全くといっていいほど、分析をしない環境 DBって見づらいよね?を言い訳に、分析してもらえない環境
サーバのログで業務部隊に資料を作って貰おうとしたら、拒否
Copyright © 2018 Cavity.LLC All Rights Reserved. やりたかった事 非エンジニアが全くといっていいほど、分析をしない環境 DBって見づらいよね?を言い訳に、分析してもらえない環境
サーバのログで業務部隊に資料を作って貰おうとしたら、拒否 これを打破したい (無理な形であっても)
Copyright © 2018 Cavity.LLC All Rights Reserved. モチベーションは、 無理やり
Copyright © 2018 Cavity.LLC All Rights Reserved. そう、皆が 分析が出来ると So
Happy
Copyright © 2018 Cavity.LLC All Rights Reserved. だが、正直難しい データウェアハウスやBIはプロダクト差がえぐい・・・
Copyright © 2018 Cavity.LLC All Rights Reserved. あげく、遅い
Copyright © 2018 Cavity.LLC All Rights Reserved. なので 非エンジニアは 使わない
Copyright © 2018 Cavity.LLC All Rights Reserved. 仕方なく E◦celで渡すと 壊す
Copyright © 2018 Cavity.LLC All Rights Reserved. せめて、勉強は 統計分析のみ
Copyright © 2018 Cavity.LLC All Rights Reserved. そうだ、 Platformに頼ろう
Copyright © 2018 Cavity.LLC All Rights Reserved. そうすれば データ解析だけで 生きていける
Copyright © 2018 Cavity.LLC All Rights Reserved. BBQ : Business
Big Query 単一の商材としてではなく、ビジネスパーソンの標準スキルセットとして「ビッグデー タ解析」がある世の中を創造していきたい。 ビッグデータにまつわるツールがオフィスソフトレベルで浸透し、誰もが簡単に使え る社会を実現する ※海岸の肉焼きリア充やモンハンの身内こんがり肉作成タイムじゃないっす この活動に名前をつける
Copyright © 2018 Cavity.LLC All Rights Reserved. 本日はBigQueryの話です
Copyright © 2018 Cavity.LLC All Rights Reserved. GCP ? Googleが提供するプラットフォーム上にあるサービス群。
何がすごいって・・・ 公式ドキュメント 参照! 僕は関係あるとこだけ
Copyright © 2018 Cavity.LLC All Rights Reserved. GCP de データ解析
Produce Move Store Preprocess Analyze Watch over next
Copyright © 2018 Cavity.LLC All Rights Reserved. GCP de データ解析
Produce Move Store Preprocess Analyze Watch over next パイプライン
Copyright © 2018 Cavity.LLC All Rights Reserved. パイプライン? 複数のサービスをつなぎ、目的のビジネスロジックを完成させる ex.)
GCE + Pub/Sub + Cloud storage ex.) Bigtable + Dataproc + Bigquery + 3rd-party BI product 手段は選びません
Copyright © 2018 Cavity.LLC All Rights Reserved. パイプライン? 複数のサービスをつなぎ、目的のビジネスロジックを完成させる ex.)
GCE + Pub/Sub + Cloud storage ex.) Bigtable + Dataproc + Bigquery + 3rd-party BI product 便利なものは何でも使う
Copyright © 2018 Cavity.LLC All Rights Reserved. パイプライン? 複数のサービスをつなぎ、目的のビジネスロジックを完成させる ex.)
GCE + Pub/Sub + Cloud storage ex.) Bigtable + Dataproc + Bigquery + 3rd-party BI product Dataflowもpipeline serviceだけど ここでは便宜上、 パイプライン = データパイプライン
Copyright © 2018 Cavity.LLC All Rights Reserved. BigQuery ? 高速かつ高スケーラビリティでコスト効率に優れた エンタープライズ向け、フルマネージドデータ
ウェアハウス #最近UIが急に統合され、戸惑う人多数でしたが... 何も考えなくていい、 データウェアハウス
Copyright © 2018 Cavity.LLC All Rights Reserved. BigQuery ? 分析基盤を準備する必要が無いので、早く始められます 毎月、1TBの分析が無料枠があるけど、中々減りません
毎月、10GBのデータ保存が無料枠があり、練習用には楽々 あとは、Not Bigでも自分のデータがあればOK まずはBQでデータ解析が学べます
Copyright © 2018 Cavity.LLC All Rights Reserved. BigQuery ? ドキュメントは公式(特に【概念】がおすすめ) クラウド屋さんのドキュメントも読んでいいかも
ただQiita含めた軽めの記事は、古いと使えないものが多い Qwiklabsですら、画面仕様とか古いままだったりする 読むより、使え
Copyright © 2018 Cavity.LLC All Rights Reserved. データウェアハウス? • データの倉庫で、何らかの判断や分析材料として利用が主目的
• SAP/Oracleなどが代表格で、専門のSEが運用することも多い • データマイニングツールと呼ばれる分析ツールの利用 • データマートと呼ばれる利用目的別のDBを作るケースも多い (顧客情報(CRM) + 自社売上管理DB など)
Copyright © 2018 Cavity.LLC All Rights Reserved. データウェアハウス? • DBとの決定的な違いは
◦ トランザクションレベルでの性能は期待しない ◦ 更新しない(する場合は追加、もしくはコピーで再度マート化 ◦ 削除なし(する場合はデータセットもろとも削除
データ解析系のGCPサービス • Cloud Storage • Bigtable • Spanner • Cloud
Pub/Sub • Cloud ML Engine • Google Drive • Google Marketing Platform • Google Ads • Youtube • BigQuery • Dataflow • Dataproc • Dataprep • Datastudio • Google Spread sheet
Copyright © 2018 Cavity.LLC All Rights Reserved. Easy try&error. Cannot
break. This is Happy.
パイプライン例 1 複数の仮想マシンログの集約
サーバからコマンドログを収集 Architecture: Script log > BigQuery : Direct stored into
BigQuery Preprocessing Cloud Dataprep Query BiqQuery Analyze Datastudio Data producer Compute Engine Others source Virtual Machine Others source Virtual Machine Others source Virtual Machine Survey logger Python script Unstructured Spreadsheet
パイプライン例 2 データパイプラインのミニマム構成
Data source Cloud Storage Webサイトの表をBBQしてみる Architecture: Unstructured Data > Dataprep
and BiqQuery with Datastudio - BBQ Preprocessing Cloud Dataprep Query BiqQuery Analyze Datastudio csv / tsv Google Sheets Unstructured Spreadsheet
https://github.com/wakayama-pref-org
データリフト おまけの話
データリフト 社内や倉庫眠る紙媒体の業務データを全てクラウドへリフト →ダークデータのクラウドリフト 売上伝票 日報 クレーム 対応結果 仕入伝票 Cavity
Scan Scanner Payment log Dark Data Data source Cloud Storage
ダークデータのリフト Architecture: Unstructured Data > Cloud Storage and BiqQuery - DataLift Query BiqQuery Analyze Datastudio csv / tsv Google Sheets Excel/csv/tsv Excel Receipt Dark Data behavior Dark Data human log Dark Data
Let’s BBQ with us !
Thank you !