Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GUIプリパレーションツールに潜む光と闇(voovovo)
Search
voovovo
April 19, 2020
Business
1
640
GUIプリパレーションツールに潜む光と闇(voovovo)
voovovo
April 19, 2020
Tweet
Share
Other Decks in Business
See All in Business
Growth Book
kuradashi
0
610
変化を抱擁するシステムの作り方〜「人が増えても速くならない」より
kuranuki
8
3.1k
VISASQ: ABOUT DEV TEAM
eikohashiba
6
40k
週4社員しながら個人開発にベットする / Betting on Personal Projects While Working a Four-Day Week
kohii00
4
3.1k
【素人向け生成AI入門】保健師のチカラにAIをプラス!
minamototeruya
0
210
インキュデータ会社紹介資料
okitsu
3
49k
Chatwork×BPaaS×AIエージェントで創る 次世代コーディネート基盤
kubell_hr
0
3.2k
【新卒向け】株式会社リブに興味のある方へ
libinc
0
10k
jinjer recruiting pitch
jinjer_official
0
130k
NEXERA_ゲーム学習の未来
nexera
0
670
株式会社Domuz会社紹介資料(採用)
kimpachi_d
0
49k
株式会社アペルザ_中途採用向け会社紹介資料
hr_team_aperza
4
140k
Featured
See All Featured
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
79
Being A Developer After 40
akosma
91
590k
Exploring anti-patterns in Rails
aemeredith
2
230
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Paper Plane
katiecoart
PRO
0
45k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
130
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
2
79
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
1
36
Building AI with AI
inesmontani
PRO
1
620
Done Done
chrislema
186
16k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
65
35k
Transcript
データアナリスト Vo Nhat Huy (voovovo) GUIプリパレーションツールに潜む 光 と ・・ 闇
アウトライン • GUIプリパレーションツールとは? • メリット • デメリット • 対策 2
自己紹介 名前:Vo Nhat Huy (voovovo) 会社:株式会社truestar 肩書:シニアアナリスト 仕事:↓導入・技術サポート 3 ベトナム人独身男性
(30)
GUIプリパレーションツールとは? 4
GUIプリパレーションツールとは • データ抽出・加工等の前処理 • グラフィックUIベース • クリック、ドラッグアンドドロップ • コーディング不要 •
ビジネスアナリスト、データアナリスト、データサイエンティスト向け • ビジネスユーザー向けでもある 5
GUIプリパレーションツールとは ツール紹介 6 Alteryx Tableau Prep DataSpider Informatica Talend Trifacta
GUIプリパレーションツールとは ツール紹介 7 Alteryx
GUIプリパレーションツールとは ツール紹介 8 • ETL処理 • 機械学習 • 空間情報処理 •
R・Pythonスクリプト組み込み • レポート自動化 • 「Code free, Code friendly」
メリット 9
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 10
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 11
メリット 人ベースでの社内リソース効率化 • Before 12 いろいろできちゃう 凄いデータサイエンティスト 社内で重宝されてる 凄腕データ系の人たち ・データサイエンティスト
・データエンジニア等など スキルも知見もあり重宝されがゆえに・・・
メリット 人ベースでの社内リソース効率化 • Before 13 あれ ほしい データ 作って いい感じで
よろしく いろいろできてしまった 凄いデータサイエンティスト 大量の 依頼
メリット 人ベースでの社内リソース効率化 • Before 14 いろいろ参ってしまった 凄いデータサイエンティスト スキルも知見もあり重宝されがゆえに・・・ 本来やりたい 高度な分析に避ける時間
が無くなってしまう
メリット 人ベースでの社内リソース効率化 • After 15 時間ができ始めた 凄いデータサイエンティスト 大量の 依頼
メリット 人ベースでの社内リソース効率化 • After 16 本領を発揮した 凄いデータサイエンティスト 依頼してきていたビジネスユーザーでも 軽度の処理を任せられる 本領である高度な分析に時間をさ
けられる
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 17
メリット ラーニングコストの低さ 簡易な処理ができるまでの習得時間が短い 18 Python、R、SQLの記法、仕組み データ構造 サービス連携、API ツールの使用法 データ構造 前処理含めた
色々な処理 ビジネスユーザが使う分だけの 前処理
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 19
メリット 処理の可視化 処理の可視化・俯瞰ができ共有しやすい 20
デメリット 21
デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 22
デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 23
デメリット 個人ベースの定義の乱発化 末端ユーザーが増えることで同じ値を出すのにもユーザーに よって定義が違う事案が増える(※更に増える) 24 売上=単価*個数 売上= システムがなんか出し た数字 売上=単価*個数
+忖度ロジック
デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 25
デメリット 金額コストの高さ 単純に高い 26
デメリット 金額コストの高さ 単純に高い 27
デメリット 金額コストの高さ 効率化・自動化など コストカット目線で ビジネスサイドが検討してくるため、費用対効果の費用に目が行きがちになる 28
デメリット 金額コストの高さ 効率化・自動化など コストカット目線で ビジネスサイドが検討してくるため、費用対効果の費用に目が行きがちになる 効果はデータ側の人じゃないので 検討時点ではよくわかってない 29
デメリット • 個人ベースの定義の乱発化 • 価格コストの高さ • 処理のカオス化 30
デメリット 処理のカオス化 ラーニングコストが低い故にデータ側の職じゃない人でもすぐに処理実装・実行 ができる。共有もしやすい。 ↓ 共有のための作法・統制が取れないまま走りが ちになる 31
デメリット 処理のカオス化 理想 32
デメリット 処理のカオス化 現実 33 「なんか動かなくなったから 改修して」 だと・・・? これで・・・?
対策 34
対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 35
対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 36 データマネジメント担当を置く
対策 データマネジメント担当を置く 定義や作法のコントロールのために • データカタログの導入検討 • 定義書の概念普及 • 共有作法などツール展開後を見据えた教育 等を担うチャンピオンとよばれるポジションを置くか育てる
37
対策 データマネジメント担当を置く チャンピオンとは: ツールのスペシャリストであり、社内ユーザーに展開する際のロールモデルになり える人 CoE(Center of Excellence)でも化 ビジネス寄りのデータの人、データ寄りのビジネスの人の2人いるとなお良い 38
対策 データマネジメント担当を置く 39 CoE チャンピオン 少数精鋭での 育成後 各組織へ
対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 40 検討時に意見を言える データ側の人を必ず加える
対策 検討時に意見を言えるデータ側の人を必ず加える 費用対効果の効果の部分を説明できるデータ側の人間を検討チームに入 れる。 この時だいたい力関係的にビジネス側の人が強い傾向があるため、 モノ言える ※ データの人をお勧めする 41
対策 検討時に意見を言えるデータ側の人を必ず加える 費用対効果の効果の部分を説明できるデータ側の人間を検討チームに入 れる。 この時だいたい力関係的にビジネス側の人が強い傾向があるため、 モノ言える ※ データの人をお勧めする ※いなかったら、強くなれ 42
まとめ 43
まとめ 便利になるGUIプリパレーションツール導入の時には… • データマネジメント強化のため、チャンピオンを置く • モノ言えるデータ側の人を用意する 44
データラーニングギルド 第1回 DLG Cross 資料 GUIプリパレーションツールに潜む光と闇 Vo Nhat Huy (voovovo)
• 参考サイト • https://www.irasutoya.com/ • https://www.alteryx.com/ja/products/platform- details/pricing • https://www.dnp.co.jp/biz/st/digital- marketing/column/detail/015data- preparation.html 45