Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20190418_データ活用よろず相談#01(at G's BASE FUKUOKA)~ひとまずこの10年くらいの流れを振り返ってみるの巻~
Search
NobuakiOshiro
April 18, 2019
Business
1
220
20190418_データ活用よろず相談#01(at G's BASE FUKUOKA)~ひとまずこの10年くらいの流れを振り返ってみるの巻~
https://nobdata.connpass.com/event/126918/
NobuakiOshiro
April 18, 2019
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
LT : ChatGPT-4でキャラクターのステータスを設定して対戦するロールプレイの実験メモ
doradora09
0
34
20240418_Google ColabにLLMが搭載されたようなのでPython x データ分析の勉強方法を考えてみる
doradora09
0
170
20240413_生成AI関連書籍_流し読みの所感
doradora09
0
27
20240330_img2imgで昔のゲーム画像をいい感じにする
doradora09
1
57
20240309_LT_ChatGPT-4対応のCursorエディタで R言語が動かないかちょっと触ってみた話
doradora09
0
110
20240302_ChatGPTで交通事故分析_ハンズオン_公開用
doradora09
0
150
20240229_20分で速習するChatGPT-4でできること
doradora09
0
230
20240217_CIVITAIの話をしようと思ったらOpenAI Soraが出てきたのでそちらの情報共有.pdf
doradora09
0
54
20240209_丸善博多_データで話す組織_出版記念ミニトーク.pdf
doradora09
0
120
Other Decks in Business
See All in Business
Experience counts: why SEO needs a name change
emilygoodyear
0
130
株式会社トラストバンク_採用ピッチ資料
sugahara
0
880
もやもやを開きあうふり返りによって組織に生まれる変化とは/ふりかえりカンファレンス2024
chiemitaki
1
790
TECH HIRE |「大胆なポジションの開発」によって ハイクラス人材を直接応募で4名採用できた話
trackrecords
PRO
0
430
#CMC_Meetup コミュニティの主体がCSからマーケに変わって気づいた良さの違い
ktkn1129
0
350
TUCUMCARI_ROADRUNNER LODGE
dona56
PRO
0
170
新卒向けふりかえり研修
viva_tweet_x
10
2.5k
カジュアル面談って、もっとカジュアルに していいの / informal session #jasstnano
pineapplecandy
0
150
We are Wunderbar, Culture Deck Full
wunderbar
0
490
株式会社gecogeco 会社紹介資料
gecogeco
1
1.6k
タケウチグループRecruit
takeuchigroup
0
8.5k
Mercari-Fact-book_en
mercari_inc
1
18k
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
Raft: Consensus for Rubyists
vanstee
133
6.3k
Debugging Ruby Performance
tmm1
70
11k
Music & Morning Musume
bryan
41
5.6k
VelocityConf: Rendering Performance Case Studies
addyosmani
321
23k
Principles of Awesome APIs and How to Build Them.
keavy
121
16k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
8
3.4k
Designing the Hi-DPI Web
ddemaree
276
33k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
226
51k
Adopting Sorbet at Scale
ufuk
69
8.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
13
4.6k
Optimizing for Happiness
mojombo
370
69k
Transcript
データ活用よろず相談 #01 (at G's BASE FUKUOKA) ~ひとまずこの10年くらいの流れを 振り返ってみるの巻~ NOB DATA株式会社
大城
自己紹介 • NOB DATA株式会社 代表取締役 • 大城 信晃 • データサイエンティスト
• 沖縄 -> 東京(7年) -> 福岡(2年) • ヤフー -> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 設立 (2018/9) • 言語 • R : 初心者 • Python : 勉強中 • 分析コミュニティ運営(後述) • のべ2200名規模 • Tokyo.R, fukuoka.R, 意思決定のためのデータ分析勉強会, PyData.Fukuoka https://nobdata.co.jp/ 2
この10年 くらい • 保険、金融 • 広告 • レコメンド … •
顧客管理(CRM) • ダイレクトマーケ • セールスフォース • グロースハック … 確率UPの世界 売り上げUPの世界 DMP (データの 統合基盤) クラウドの台頭 ストレージの 低価格化 データの拡大 (スマホ、IoT) 応用 データサイエンス 機械学習 AI (で、何かをやる) 新たな専門職の誕生 (DS、AIエンジニア) 環境変化
データ活用のパターンと実現可能性 • コストカット系 • 堅い分野。だが限界あり • 改善系 • 売り上げUPのための投資 •
新規事業系 • 当たればでかいがほぼ外れる(実験) • 単純作業置き換え • 自動化、(RPA) • 意思決定支援 • 解釈可能な分析 • モデリング • 精度が上がれば ブラックボックスでもOK
ざっくりの年ごとのトピック 2009年 2012年 2015年 2017年 2019年 ガラケー全盛期 SNSの普及 クラウドの普及 スマホシフト
スマホでのプレイ ヤーチェンジ 競争力としてのAI リーマンショック 発生 2011年に東日本大 震災 スマホがPCユー ザーを超え始める インスタとかこの 辺・・? まさかのメルカリ VR・ARデバイス も徐々に安価に iphone3GS登場 LINEの普及 ガチャゲー全盛期 ユーチューバー ドローン (自動運転) 令和元年 米国、中国の2大 体制が固まりつつ ヤフーにおりまし た (5000人くらい) ブラウザゲーム全 盛期 DeNA、グリー全 盛期 DMP、MAなど データ分析専業の ベンチャーにJOIN LINE Fukuokaへ 地方でもデータ分 析が可能に 新卒分析者に Indeedが1150万 円の求人開始 2010年に第1回 Tokyo.R勉強会 ビッグデータ・ データサイエン ティストという ワードがで始める 機械学習・IoTと いうワードがで始 める 2014年にDS協会 AI系スクール業 AIというワードが で始める (加熱気味) 地方でのAI系ス クール業展開 Tokyo.R #77 fukuoka.R #13
ヤフー時代(2009-2015) 主な関わりのあるサービス • ヤフーショッピング • ヤフオク • 製品DB • Yahoo
DMPの設計・開発 • 広告主向けのデータ分析 https://japan.zdnet.com/article/35059965/2/ 2012年ごろから「マルチ」ビッグデータホルダーとして Web企業では国内最大規模のデータ活用を推進
DATUM STUDIO時代(2015-2016) 主な関わりのあるサービス • 不動産 • 人材派遣 • 自動車 •
ゲーム • 広告 • アクセス解析 8番目の社員として1年半で80名まで企業成長を牽引。 なお2018年10月にはKDDIグループのSupership社にバイアウト完了
LINE Fukuoka時代(2017-2018) 主な関わりのあるサービス • LINE LIVE グロースハック • LINE NEWS
グロースハック • 各種審査オペレーション • インターン生の育成 • 外国人メンバーの育成 LINE NEWSに関してはスマートフォン単体では ヤフーを抜いて日本一の規模までグロース https://linecorp.com/ja/pr/news/ja/2017/1729 LINE NEWS 月間アクティブユーザー数が5,900万人を突破
AI技術活用が競争力となる時代 • インドの格安ホテル「OYO(オヨ)」が2018年度内に日本進 出、ITを駆使した運営で急成長 • https://www.hotelier.jp/inboundnews/other/20181022.html • 同社の高速成長のカギは、ITを駆使した運営だ。約8,500人の社 員のうち、700人超がデータ科学・人工知能(AI)・ソフトウ エアなどのIT技術者だという。進出した地域の宿泊需要データ
をAIで常時分析し、すべての空室の料金を個別に常時変化させ ている。また、地域内での需要のミスマッチを最小化すると同 時に、その地域内のホテル全体の稼働率を最大化する。
事前質問
Q.実際に今データが使われている事例 • 大小問わなければ、かなり多い (広すぎるので課題ベースの方が絞りやすいかも?) • リスク予測モデル : 貸し倒れ率計算、保険の料率設定 • マッチング系
: Amazonによるレコメンド、 Web広告、 Indeed • 最適化問題 : Uberによる巡回ルート最適化、ゲームの難易度設定 • 予測で日常的なものだと : 天気予報 • 態度変容を促す意味では最強 • データ視点での拡張 :スポーツ x データ、 人事 x データ、教育xデータ、不動産xデータ、… • 他分野とのクロス : 医療x購買、運動x保険、 • その他 • 意思決定支援、作業自動化、画像解析、音声解析、etc..
改善幅 x 金額 =ビジネスインパクト 改善幅 事例 検討の価値あり 1%の改善 広告のターゲティング精度改善 ・100億円規模の1%の改善なら1億円
の効果 ・広告、インフラ、医療分野など 10%の改善 タクシーの需要予測 ・1000万の売上を10%上げる (・10万円の10%だと厳しい) 50%の改善 新規ユーザー獲得 (グロースハック ) 離職率改善 ・50%はよっぽどうまく行くケース ・もともと業務改善が全く手付かずの 場合は口実としてデータやAIを持ち出 すのは一手 タスクを0に (自動化文脈) AIによる保育園の自動振り分け ・アウトソーシングや業務フロー改善 もセットで考えた方が良い ・AI開発、運用のコストと比較 12
Q. 検索・閲覧履歴からユーザーの嗜好に近い作品 をオススメする精度を高める方法を知りたい • 古典的な方法 • ターゲティング .. ユーザー属性等を利用 •
リターゲティング .. 前に見たものを再度出す • 機械学習を使う方法 • 教師あり学習モデル • 正解データに近い動きをした人を狙う(ランダムフォレストとか) • 行動ログ、閲覧ログ、広告clickログ、etc.. • 教師なしモデル • クラスタリングで近いものを分類(k-meansとか) • 属性、興味関心推定 • アンケートと組み合わせて行動パターンの近いユーザーの属性や興味関心をラベリング
Q.分析するデータをどうやって集めているのか • 自社データ • 業務用DB • 紙の情報を電子化 • 他社データ •
リサーチ業者から購入 • 他社サイトをクロール & スクレイピング • リサーチデータ • アンケート • 国の統計情報 • オープンデータ • Webサイト • サーバサイドのアクセスログ • Cookie情報、ログイン情報 • その他ロギングした情報 • ゲーム • ゲーム基盤DB • 行動ログ • ロガーを仕込んで発火 • JSのビーコン等 • 動画 • カメラ映像の解析
問い: ちなみにこの辺知ってますか? • ブラウザのリファラー情報 • URLのパラメータ • Webサーバーのアクセスログ
Q.医療業界で、 ①個人情報を扱う際の注意点、 ②実際に今データが扱われている事例 (新しい切り口での解析があれば) (医療業界専門ではありませんが) ・個人情報を扱う際の注意点 ・個人情報保護法を守る、情報漏洩対策、データの利用許諾 ・特に既往歴等の病気関連のデータはセンシティブなので注意 ・利用の際は個人情報のマスクやN匿名化など ・データ活用の事例
・画像解析との組み合わせ(内視鏡や細胞診など) ・睡眠治療のためのアプリを処方(サスメド社) ・あとは遺伝子検査系が海外だと流行ってそうな印象
国の動向に は注意(規制 したがり) https://www.nikkei.com/artic le/DGXMZO43867770X10C1 9A4MM8000/
注意
実は一足飛びにはできない分野 将来の絵を見せつつ基盤を作れるか
10年来のプレーヤーは もともとデータは目的ではない • ヤフーの場合 • 検索(ディレクトリ)サービス • 空いた枠に広告枠、という発明 • 広告の請求のためデータ基盤整備
• データを使った広告の精度UP、というループ • CCCの場合 • ビデオやDVDレンタルのための顧客情報整備 • Tポイントという形で様々な業種にアプローチ • 購買データなどを活用したマーケティング利用 本業の 副産物としての データ