20190418_データ活用よろず相談#01(at G's BASE FUKUOKA)~ひとまずこの10年くらいの流れを振り返ってみるの巻~

データ活用よろず相談 #01 (at G's BASE FUKUOKA) ~ひとまずこの10年くらいの流れを振り返ってみるの巻~ NOB DATA株式会社
大城

自己紹介 • NOB DATA株式会社代表取締役 • 大城信晃 • データサイエンティスト
• 沖縄 -> 東京(7年) -> 福岡(2年) • ヤフー -> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 設立 (2018/9) • 言語 • R : 初心者 • Python : 勉強中 • 分析コミュニティ運営(後述) • のべ2200名規模 • Tokyo.R, fukuoka.R, 意思決定のためのデータ分析勉強会, PyData.Fukuoka https://nobdata.co.jp/ 2

この１０年くらい • 保険、金融 • 広告 • レコメンド … •
顧客管理(CRM) • ダイレクトマーケ • セールスフォース • グロースハック … 確率UPの世界売り上げUPの世界 DMP (データの統合基盤) クラウドの台頭ストレージの低価格化データの拡大 (スマホ、IoT) 応用データサイエンス機械学習 AI (で、何かをやる) 新たな専門職の誕生 (DS、AIエンジニア) 環境変化

データ活用のパターンと実現可能性 • コストカット系 • 堅い分野。だが限界あり • 改善系 • 売り上げUPのための投資 •
新規事業系 • 当たればでかいがほぼ外れる(実験) • 単純作業置き換え • 自動化、(RPA) • 意思決定支援 • 解釈可能な分析 • モデリング • 精度が上がればブラックボックスでもOK

ざっくりの年ごとのトピック 2009年 2012年 2015年 2017年 2019年ガラケー全盛期 SNSの普及クラウドの普及スマホシフト
スマホでのプレイヤーチェンジ競争力としてのAI リーマンショック発生 2011年に東日本大震災スマホがPCユーザーを超え始めるインスタとかこの辺・・？まさかのメルカリ VR・ARデバイスも徐々に安価に iphone3GS登場 LINEの普及ガチャゲー全盛期ユーチューバードローン (自動運転) 令和元年米国、中国の２大体制が固まりつつヤフーにおりました (5000人くらい) ブラウザゲーム全盛期 DeNA、グリー全盛期 DMP、MAなどデータ分析専業のベンチャーにJOIN LINE Fukuokaへ地方でもデータ分析が可能に新卒分析者に Indeedが1150万円の求人開始 2010年に第１回 Tokyo.R勉強会ビッグデータ・データサイエンティストというワードがで始める機械学習・IoTというワードがで始める 2014年にDS協会 AI系スクール業 AIというワードがで始める (加熱気味) 地方でのAI系スクール業展開 Tokyo.R #77 fukuoka.R #13

ヤフー時代(2009-2015) 主な関わりのあるサービス • ヤフーショッピング • ヤフオク • 製品DB • Yahoo
DMPの設計・開発 • 広告主向けのデータ分析 https://japan.zdnet.com/article/35059965/2/ 2012年ごろから「マルチ」ビッグデータホルダーとして Web企業では国内最大規模のデータ活用を推進

DATUM STUDIO時代(2015-2016) 主な関わりのあるサービス • 不動産 • 人材派遣 • 自動車 •
ゲーム • 広告 • アクセス解析 8番目の社員として1年半で80名まで企業成長を牽引。なお2018年10月にはKDDIグループのSupership社にバイアウト完了

LINE Fukuoka時代(2017-2018) 主な関わりのあるサービス • LINE LIVE グロースハック • LINE NEWS
グロースハック • 各種審査オペレーション • インターン生の育成 • 外国人メンバーの育成 LINE NEWSに関してはスマートフォン単体ではヤフーを抜いて日本一の規模までグロース https://linecorp.com/ja/pr/news/ja/2017/1729 LINE NEWS 月間アクティブユーザー数が5,900万人を突破

AI技術活用が競争力となる時代 • インドの格安ホテル「OYO（オヨ）」が2018年度内に日本進出、ITを駆使した運営で急成長 • https://www.hotelier.jp/inboundnews/other/20181022.html • 同社の高速成長のカギは、ITを駆使した運営だ。約8,500人の社員のうち、700人超がデータ科学・人工知能（AI）・ソフトウエアなどのIT技術者だという。進出した地域の宿泊需要データ
をAIで常時分析し、すべての空室の料金を個別に常時変化させている。また、地域内での需要のミスマッチを最小化すると同時に、その地域内のホテル全体の稼働率を最大化する。

事前質問

Q.実際に今データが使われている事例 • 大小問わなければ、かなり多い (広すぎるので課題ベースの方が絞りやすいかも？) • リスク予測モデル : 貸し倒れ率計算、保険の料率設定 • マッチング系
: Amazonによるレコメンド、 Web広告、 Indeed • 最適化問題 : Uberによる巡回ルート最適化、ゲームの難易度設定 • 予測で日常的なものだと : 天気予報 • 態度変容を促す意味では最強 • データ視点での拡張 :スポーツ x データ、人事 x データ、教育xデータ、不動産xデータ、… • 他分野とのクロス : 医療x購買、運動x保険、 • その他 • 意思決定支援、作業自動化、画像解析、音声解析、etc..

改善幅 x 金額 =ビジネスインパクト改善幅事例検討の価値あり 1%の改善広告のターゲティング精度改善・100億円規模の1%の改善なら1億円
の効果・広告、インフラ、医療分野など 10%の改善タクシーの需要予測・1000万の売上を10%上げる (・10万円の10%だと厳しい) 50%の改善新規ユーザー獲得 (グロースハック ) 離職率改善・50%はよっぽどうまく行くケース・もともと業務改善が全く手付かずの場合は口実としてデータやAIを持ち出すのは一手タスクを0に (自動化文脈) AIによる保育園の自動振り分け・アウトソーシングや業務フロー改善もセットで考えた方が良い・AI開発、運用のコストと比較 12

Q. 検索・閲覧履歴からユーザーの嗜好に近い作品をオススメする精度を高める方法を知りたい • 古典的な方法 • ターゲティング .. ユーザー属性等を利用 •
リターゲティング .. 前に見たものを再度出す • 機械学習を使う方法 • 教師あり学習モデル • 正解データに近い動きをした人を狙う(ランダムフォレストとか) • 行動ログ、閲覧ログ、広告clickログ、etc.. • 教師なしモデル • クラスタリングで近いものを分類(k-meansとか) • 属性、興味関心推定 • アンケートと組み合わせて行動パターンの近いユーザーの属性や興味関心をラベリング

Q.分析するデータをどうやって集めているのか • 自社データ • 業務用DB • 紙の情報を電子化 • 他社データ •
リサーチ業者から購入 • 他社サイトをクロール & スクレイピング • リサーチデータ • アンケート • 国の統計情報 • オープンデータ • Webサイト • サーバサイドのアクセスログ • Cookie情報、ログイン情報 • その他ロギングした情報 • ゲーム • ゲーム基盤DB • 行動ログ • ロガーを仕込んで発火 • JSのビーコン等 • 動画 • カメラ映像の解析

問い: ちなみにこの辺知ってますか？ • ブラウザのリファラー情報 • URLのパラメータ • Webサーバーのアクセスログ

Q.医療業界で、 ①個人情報を扱う際の注意点、 ②実際に今データが扱われている事例（新しい切り口での解析があれば） (医療業界専門ではありませんが) ・個人情報を扱う際の注意点・個人情報保護法を守る、情報漏洩対策、データの利用許諾・特に既往歴等の病気関連のデータはセンシティブなので注意・利用の際は個人情報のマスクやN匿名化など・データ活用の事例
・画像解析との組み合わせ(内視鏡や細胞診など) ・睡眠治療のためのアプリを処方(サスメド社) ・あとは遺伝子検査系が海外だと流行ってそうな印象

国の動向には注意(規制したがり) https://www.nikkei.com/artic le/DGXMZO43867770X10C1 9A4MM8000/

注意

実は一足飛びにはできない分野将来の絵を見せつつ基盤を作れるか

10年来のプレーヤーはもともとデータは目的ではない • ヤフーの場合 • 検索(ディレクトリ)サービス • 空いた枠に広告枠、という発明 • 広告の請求のためデータ基盤整備
• データを使った広告の精度UP、というループ • CCCの場合 • ビデオやDVDレンタルのための顧客情報整備 • Tポイントという形で様々な業種にアプローチ • 購買データなどを活用したマーケティング利用本業の副産物としてのデータ

20190418_データ活用よろず相談#01(at G's BASE FUKUOKA)~ひ...

20190418_データ活用よろず相談#01(at G's BASE FUKUOKA)~ひとまずこの10年くらいの流れを振り返ってみるの巻~

NobuakiOshiro PRO

More Decks by NobuakiOshiro

Other Decks in Business

Featured

Transcript

データ活用よろず相談 #01 (at G's BASE FUKUOKA) ~ひとまずこの10年くらいの流れを振り返ってみるの巻~ NOB DATA株式会社

自己紹介 • NOB DATA株式会社代表取締役 • 大城信晃 • データサイエンティスト

この１０年くらい • 保険、金融 • 広告 • レコメンド … •

データ活用のパターンと実現可能性 • コストカット系 • 堅い分野。だが限界あり • 改善系 • 売り上げUPのための投資 •

ざっくりの年ごとのトピック 2009年 2012年 2015年 2017年 2019年ガラケー全盛期 SNSの普及クラウドの普及スマホシフト

ヤフー時代(2009-2015) 主な関わりのあるサービス • ヤフーショッピング • ヤフオク • 製品DB • Yahoo

DATUM STUDIO時代(2015-2016) 主な関わりのあるサービス • 不動産 • 人材派遣 • 自動車 •

LINE Fukuoka時代(2017-2018) 主な関わりのあるサービス • LINE LIVE グロースハック • LINE NEWS

事前質問

Q.実際に今データが使われている事例 • 大小問わなければ、かなり多い (広すぎるので課題ベースの方が絞りやすいかも？) • リスク予測モデル : 貸し倒れ率計算、保険の料率設定 • マッチング系

改善幅 x 金額 =ビジネスインパクト改善幅事例検討の価値あり 1%の改善広告のターゲティング精度改善・100億円規模の1%の改善なら1億円

Q. 検索・閲覧履歴からユーザーの嗜好に近い作品をオススメする精度を高める方法を知りたい • 古典的な方法 • ターゲティング .. ユーザー属性等を利用 •

Q.分析するデータをどうやって集めているのか • 自社データ • 業務用DB • 紙の情報を電子化 • 他社データ •

問い: ちなみにこの辺知ってますか？ • ブラウザのリファラー情報 • URLのパラメータ • Webサーバーのアクセスログ

国の動向には注意(規制したがり) https://www.nikkei.com/artic le/DGXMZO43867770X10C1 9A4MM8000/

注意

実は一足飛びにはできない分野将来の絵を見せつつ基盤を作れるか

10年来のプレーヤーはもともとデータは目的ではない • ヤフーの場合 • 検索(ディレクトリ)サービス • 空いた枠に広告枠、という発明 • 広告の請求のためデータ基盤整備