Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GUIプリパレーションツールに潜む光と闇(voovovo)
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
voovovo
April 19, 2020
Business
1
650
GUIプリパレーションツールに潜む光と闇(voovovo)
voovovo
April 19, 2020
Tweet
Share
Other Decks in Business
See All in Business
12 keywords of Data Dashboard
hik0107
7
920
Q4 2025 Earnings release
cmbtech
PRO
0
790
【DearOne】Dear Newest Member
hrm
2
16k
jinjer recruiting pitch
jinjer_official
0
180k
人々にとってかけがえのないプロダクトを作るには ~顧客の日常に紛れる "not not" を見つけろ!~ #pdmyy
bonotake
2
220
㈱サンエー 会社 採用資料
uemura2024
0
1.7k
GMOリザーブプラス|カルチャーデック "Way Book"
gmo_rp
0
240
繋ぐだけで業務が変わる!TROCCO×kintoneで構築する、フロントとバックエンドをノンストップで結ぶデータ循環
primenumberusergroup
0
150
その"インサイト"、本当に意味ありますか? 〜Think N1な深いインサイトの見つけ方〜
inagakikay
1
1.1k
2025年度ICT職専門研修(海外派遣研修)報告書 No.5
tokyo_metropolitan_gov_digital_hr
0
140
株式会社SunAsterisk-CompanyDeck(採用向け/会社紹介資料)
sunasterisk
PRO
0
1.3k
クラウドネイティブ型 電子カルテとセキュリティ / Cloud-Native Electronic Medical Records and Security
henryofficial
0
220
Featured
See All Featured
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
72
Testing 201, or: Great Expectations
jmmastey
46
8.1k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Statistics for Hackers
jakevdp
799
230k
Scaling GitHub
holman
464
140k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Designing Experiences People Love
moore
143
24k
Speed Design
sergeychernyshev
33
1.6k
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
The browser strikes back
jonoalderson
0
800
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
100
HDC tutorial
michielstock
1
550
Transcript
データアナリスト Vo Nhat Huy (voovovo) GUIプリパレーションツールに潜む 光 と ・・ 闇
アウトライン • GUIプリパレーションツールとは? • メリット • デメリット • 対策 2
自己紹介 名前:Vo Nhat Huy (voovovo) 会社:株式会社truestar 肩書:シニアアナリスト 仕事:↓導入・技術サポート 3 ベトナム人独身男性
(30)
GUIプリパレーションツールとは? 4
GUIプリパレーションツールとは • データ抽出・加工等の前処理 • グラフィックUIベース • クリック、ドラッグアンドドロップ • コーディング不要 •
ビジネスアナリスト、データアナリスト、データサイエンティスト向け • ビジネスユーザー向けでもある 5
GUIプリパレーションツールとは ツール紹介 6 Alteryx Tableau Prep DataSpider Informatica Talend Trifacta
GUIプリパレーションツールとは ツール紹介 7 Alteryx
GUIプリパレーションツールとは ツール紹介 8 • ETL処理 • 機械学習 • 空間情報処理 •
R・Pythonスクリプト組み込み • レポート自動化 • 「Code free, Code friendly」
メリット 9
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 10
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 11
メリット 人ベースでの社内リソース効率化 • Before 12 いろいろできちゃう 凄いデータサイエンティスト 社内で重宝されてる 凄腕データ系の人たち ・データサイエンティスト
・データエンジニア等など スキルも知見もあり重宝されがゆえに・・・
メリット 人ベースでの社内リソース効率化 • Before 13 あれ ほしい データ 作って いい感じで
よろしく いろいろできてしまった 凄いデータサイエンティスト 大量の 依頼
メリット 人ベースでの社内リソース効率化 • Before 14 いろいろ参ってしまった 凄いデータサイエンティスト スキルも知見もあり重宝されがゆえに・・・ 本来やりたい 高度な分析に避ける時間
が無くなってしまう
メリット 人ベースでの社内リソース効率化 • After 15 時間ができ始めた 凄いデータサイエンティスト 大量の 依頼
メリット 人ベースでの社内リソース効率化 • After 16 本領を発揮した 凄いデータサイエンティスト 依頼してきていたビジネスユーザーでも 軽度の処理を任せられる 本領である高度な分析に時間をさ
けられる
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 17
メリット ラーニングコストの低さ 簡易な処理ができるまでの習得時間が短い 18 Python、R、SQLの記法、仕組み データ構造 サービス連携、API ツールの使用法 データ構造 前処理含めた
色々な処理 ビジネスユーザが使う分だけの 前処理
メリット • 人ベースでの社内リソース効率化 • ラーニングコストの低さ • 処理の可視化 19
メリット 処理の可視化 処理の可視化・俯瞰ができ共有しやすい 20
デメリット 21
デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 22
デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 23
デメリット 個人ベースの定義の乱発化 末端ユーザーが増えることで同じ値を出すのにもユーザーに よって定義が違う事案が増える(※更に増える) 24 売上=単価*個数 売上= システムがなんか出し た数字 売上=単価*個数
+忖度ロジック
デメリット • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 25
デメリット 金額コストの高さ 単純に高い 26
デメリット 金額コストの高さ 単純に高い 27
デメリット 金額コストの高さ 効率化・自動化など コストカット目線で ビジネスサイドが検討してくるため、費用対効果の費用に目が行きがちになる 28
デメリット 金額コストの高さ 効率化・自動化など コストカット目線で ビジネスサイドが検討してくるため、費用対効果の費用に目が行きがちになる 効果はデータ側の人じゃないので 検討時点ではよくわかってない 29
デメリット • 個人ベースの定義の乱発化 • 価格コストの高さ • 処理のカオス化 30
デメリット 処理のカオス化 ラーニングコストが低い故にデータ側の職じゃない人でもすぐに処理実装・実行 ができる。共有もしやすい。 ↓ 共有のための作法・統制が取れないまま走りが ちになる 31
デメリット 処理のカオス化 理想 32
デメリット 処理のカオス化 現実 33 「なんか動かなくなったから 改修して」 だと・・・? これで・・・?
対策 34
対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 35
対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 36 データマネジメント担当を置く
対策 データマネジメント担当を置く 定義や作法のコントロールのために • データカタログの導入検討 • 定義書の概念普及 • 共有作法などツール展開後を見据えた教育 等を担うチャンピオンとよばれるポジションを置くか育てる
37
対策 データマネジメント担当を置く チャンピオンとは: ツールのスペシャリストであり、社内ユーザーに展開する際のロールモデルになり える人 CoE(Center of Excellence)でも化 ビジネス寄りのデータの人、データ寄りのビジネスの人の2人いるとなお良い 38
対策 データマネジメント担当を置く 39 CoE チャンピオン 少数精鋭での 育成後 各組織へ
対策 • 個人ベースの定義の乱発化 • 金額コストの高さ • 処理のカオス化 40 検討時に意見を言える データ側の人を必ず加える
対策 検討時に意見を言えるデータ側の人を必ず加える 費用対効果の効果の部分を説明できるデータ側の人間を検討チームに入 れる。 この時だいたい力関係的にビジネス側の人が強い傾向があるため、 モノ言える ※ データの人をお勧めする 41
対策 検討時に意見を言えるデータ側の人を必ず加える 費用対効果の効果の部分を説明できるデータ側の人間を検討チームに入 れる。 この時だいたい力関係的にビジネス側の人が強い傾向があるため、 モノ言える ※ データの人をお勧めする ※いなかったら、強くなれ 42
まとめ 43
まとめ 便利になるGUIプリパレーションツール導入の時には… • データマネジメント強化のため、チャンピオンを置く • モノ言えるデータ側の人を用意する 44
データラーニングギルド 第1回 DLG Cross 資料 GUIプリパレーションツールに潜む光と闇 Vo Nhat Huy (voovovo)
• 参考サイト • https://www.irasutoya.com/ • https://www.alteryx.com/ja/products/platform- details/pricing • https://www.dnp.co.jp/biz/st/digital- marketing/column/detail/015data- preparation.html 45