Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャレンジ!

データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャレンジ!

講義資料

640256f07e8f13830718bbf620e0515f?s=128

GA technologies

October 24, 2019
Tweet

Transcript

  1. データサイエンスで いいエリアの提案にチャレンジ! 一般社団法人データサイエンティスト協会 エントリー層向けセミナー

  2. 本日の内容 【学習目標】 • データ分析の一連の流れを体感し、データからストーリーを構築できるように なること 【Contents】(計 90分) 1. 講師紹介/会社紹介(5分) 2.

    分析による問題解決のプロセス( 45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介( 10分) 5. 参考文献 2
  3. Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.

    参考文献 3
  4. データサイエンティスト協会とは 4

  5. 株式会社GA technologies 5 5 設立年月日 2013年 3月 資本金 11億5,544万9,070円 代表取締役

    樋口龍 事業内容 • 不動産テック総合ブランド「RENOSY」の運営 • オンライン融資申込・審査手続きシステム 「Mortgage Gateway」の運営 • 「BEST BASHO」や「BLUEPRINT by RENOSY」などのAIやRPAを活用した研究開 発 • 中古マンションのリノベーション設計施工 従業員 344名(2019年4月時点) • 2018/7マザーズ上場、設立5年で売上 200 億のPropTech企業(不動産テック) • セールスなど強力なReal人材が多数在籍 の一方で、エンジニアが全社員の 44%と Technologyとの融合に注力 • 2017/4にAI Strategy Centerを設立(不動産業 界初)。技術顧問は杉山将氏 • AI Strategy CenterのVision「事業全体を見 据えて行動を起こせる研究者集団」 ⇒急成長ゆえ課題も多いですが、    Excitingな環境です!  Let’s Join us!
  6. 講師紹介:橋本 武彦 氏名 橋本 武彦(はしもと たけひこ) 所属 ㈱GA technologies AI Strategy

    Center General Manager 電気通信大学 客員准教授 キャリア サマリ • Sier(エンジニア5年/研究員2年)⇒調査会社(リサーチャー3年)⇒  ブレイン パッド(シニアデータサイエンティスト9年)を経て2017年4月から現職 • データサイエンティスト協会(前事務局長)やデータサイエンティスト育成の新 規事業の立ち上げ • 電通大、滋賀大、慶應SFC、立教大など大学や官公庁での講義や講演・執筆 など E-Mail t_hashimoto@ga-tech.co.jp Socialアカウント https://www.facebook.com/hashimoto.takehikko / @takenotabi 6
  7. 講師紹介:福中 公輔 氏名 福中 公輔(ふくなか こうすけ) 所属 ㈱   シニア・データサイエンティスト キャリア サマリ

    早稲田大学にて、統計学やデータ解析、テスト理論の研究を行った後、実務へ の応用に興味を持ち、データサイエンティストとなる。学校法人産業能率大学総 合研究所に在籍時は、企業内のデータサイエンティスト育成支援、データ解析 支援、データ解析プロジェクトのコンサルティング等に従事。一般社団法人デー タサイエンティスト協会が主催するデータサイエンスアワードにて、 年度、東 京メトロとのプロジェクト「データサイエンスと働き方改革」で最優秀賞を受賞。こ れまでにデータ活用による業務効率化の仕組みに関する特許を 件取得。 E-Mail k_fukunaka@ga-tech.co.jp URL https://uca-works.com/ 7
  8. アイスブレイク! お隣の席の方と相互に 自己紹介を 1分ずつお願いします! 8

  9. Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.

    参考文献 9
  10. ケーススタディ:新しいエリア探し • 友人から気分一新で新しいエリアで暮らそうと考えていると相談を受けました。せっ かくの機会ですので、できるだけよいエリアに家を買いたいなと言っています。 • 現在、勉強中のデータサイエンスを活用して、よいエリア(≒地域、場所)の提案に チャレンジしてみましょう! 10

  11. PPDACとは? 出典:なるほど統計学園高等部(総務省統計局) https://www.stat.go.jp/koukou/howto/process/index.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 「データに基づく問題解決のプロセス」 11

  12. Problem:ケース Q:いいエリアとは? 12

  13. Problemとは • 明確化 ◦ 問題はなにか、目的はなにか、目標はなに か、etc • 定量化 ◦ 数字で計測できるように定義

    ▪ NG:おしゃれなエリア ▪ OK:ブランド店が多いエリア 一言でいうと「問題の明確化と定量化」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 13
  14. Problem:ケースの回答例 Q:いいエリアとは? A:「便利」で「安い」エリア 14

  15. Planとは • 問題に対し ◦ 必要な素材を考え(≒データ) ◦ どう調理するか(≒分析) を描く • (筋のよい)仮説を持つことが大切

    一言でいうと「分析の設計」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 15
  16. Plan:ケース Q:「便利」で「安い」エリア  必要な素材(データ) 調理(分析) • • 16

  17. Plan:ケースの回答例 Q:「便利」で「安い」エリア  必要な素材(データ) 調理(分析) (便利) • 駅数・路線数、駅距離 • コンビニ店舗数、病院数、 etc

    (安い) • 地価、家賃、物価、etc • 他エリアとの比較 • 過去の傾向(推移)、 etc 17
  18. Dataとは • 問題に対し必要な素材が手元に揃っているこ とは基本ない • 必要な素材を ◦ どう収集するか ◦ (分析しやすいよう)どう加工するか

    手間と時間がかかるが大事 一言でいうと「(必要な素材(≒データ)の)収集と加工」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 18
  19. Data:利用データ 出典:国土交通省 地価公示 http://www.mlit.go.jp/totikensangyo/totikensangyo_fr4_000043.html 【概要】 • 国土交通省の地価公示データを主に利用(+オープンデータ) • 都心5区の20年分のデータを抽出、加工 【項目】 ※詳細別紙参照

    出典:あおぞら不動産 オフィス検索サイト https://aozora-estate.com/post-office-magazines/107/ 19
  20. Analysisとは • 現状把握(1つのデータ) ◦ 代表値や可視化により、 各変数の現状を把握 • 関係調査(2つのデータ間) ◦ 比較と傾向の観点で、 変

    数間の関係を調査 一言でいうと「現状を把握し、関係を調査」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 出典:社会人のためのデータサイエンス演習(総務省 統計局) 20
  21. Analysis:代表値と分布による現状把握 出典:社会人のためのデータサイエンス演習(総務省 統計局) 21

  22. Analysis:変数間の関係探索 出典:社会人のためのデータサイエンス演習(総務省 統計局) 22

  23. Conclusion • 統合とは ◦ PPDAを踏まえ、問題に 対し結論を提示 ◦ 結論が出ない場合、  必要なプロセスに戻る •

    新たな問題から次のサ イクルへ 一言でいうと「(各プロセスの)統合」 出典:チャンス発見の情報技術 https://www.tdupress.jp/book/b349879.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 23
  24. Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.

    参考文献 24
  25. ケーススタディ:新しいエリア探し(30分) • 友人から気分一新で春先から新しいエリアで暮らそうと考えていると相談を受けました。せっかくの機会で すので、できるだけよいエリアに家を買いたいなと言っています。 • 現在、勉強中のデータサイエンスを活用して、よいエリア(≒地域、場所)の提案にチャレンジしてみましょ う! ◦ 5つのエリアの地価公示データをもとに、よいエリア提案を 2人一組で考えてください。

    ◦ 必要に応じて外部データや情報を加味して OKです。 25
  26. ケーススタディ:記入Format(30分) (ターゲットを設定(男女 単身 ファミリー)した上で) 「便利」で「安い」おすすめエリアは? Problem 「便利」 駅・路線や店舗、公共施設や病院が多い(比較) 「安い」 地価が低い(比較)、地価の上昇が見込める(傾向)

    Plan 都心 区の地価公示データ( 年分)  ※他のデータがあれば追記 Data 参考にした 表・グラフ グラフの解釈 Anaysis ◯◯区 Conclusion 表・グラフ 解釈 表・グラフ 解釈 表・グラフ 解釈 26
  27. Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.

    参考文献 27
  28. アイスブレイク!(不動産会社社員の回答例) 28

  29. 不動産領域におけるデータサイエンス事例紹介 物件の価格って どうやって決まるの? 29

  30. 不動産領域におけるデータサイエンス事例紹介 経験豊富なエージェントが1件1件査定しています 30 【お客様】 時間をかけずもっと早 く知りたい! 【エージェント】 負荷が高く、大変!

  31. None
  32. 過去の物件情報をもとに自動査定するAIを開発 32 32 所在階 総階数 住所 竣工年 物件名 この物件は  3200万円~3800万円

    だと予測 ヒストグラムや散布図など基礎的な分析は初期の段階で必ず行っています!
  33. エントリー層のみなさまへのメッセージ 論よりRun 33

  34. Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(75分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.

    参考文献 34
  35. 参考文献 今回の登壇資料での紹介含め、主にエントリー層向けの参考情報 • なるほど統計学園高等部 - 総務省統計局 https://www.stat.go.jp/koukou/ • 社会人のためのデータサイエンス演習 https://lms.gacco.org/courses/course-v1:gacco+ga063+2019_05/about

    • 統計検定 3級 http://www.toukei-kentei.jp/about/grade3/ • データサイエンティスト協会 DSSJournal お役立ちリンク https://www.datascientist.or.jp/dssjournal/link/ 35