Slide 1

Slide 1 text

データサイエンスで いいエリアの提案にチャレンジ! 一般社団法人データサイエンティスト協会 エントリー層向けセミナー

Slide 2

Slide 2 text

本日の内容 【学習目標】 ● データ分析の一連の流れを体感し、データからストーリーを構築できるように なること 【Contents】(計 90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス( 45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介( 10分) 5. 参考文献 2

Slide 3

Slide 3 text

Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5. 参考文献 3

Slide 4

Slide 4 text

データサイエンティスト協会とは 4

Slide 5

Slide 5 text

株式会社GA technologies 5 5 設立年月日 2013年 3月 資本金 11億5,544万9,070円 代表取締役 樋口龍 事業内容 • 不動産テック総合ブランド「RENOSY」の運営 • オンライン融資申込・審査手続きシステム 「Mortgage Gateway」の運営 • 「BEST BASHO」や「BLUEPRINT by RENOSY」などのAIやRPAを活用した研究開 発 • 中古マンションのリノベーション設計施工 従業員 344名(2019年4月時点) ● 2018/7マザーズ上場、設立5年で売上 200 億のPropTech企業(不動産テック) ● セールスなど強力なReal人材が多数在籍 の一方で、エンジニアが全社員の 44%と Technologyとの融合に注力 ● 2017/4にAI Strategy Centerを設立(不動産業 界初)。技術顧問は杉山将氏 ● AI Strategy CenterのVision「事業全体を見 据えて行動を起こせる研究者集団」 ⇒急成長ゆえ課題も多いですが、    Excitingな環境です!  Let’s Join us!

Slide 6

Slide 6 text

講師紹介:橋本 武彦 氏名 橋本 武彦(はしもと たけひこ) 所属 ㈱GA technologies AI Strategy Center General Manager 電気通信大学 客員准教授 キャリア サマリ • Sier(エンジニア5年/研究員2年)⇒調査会社(リサーチャー3年)⇒  ブレイン パッド(シニアデータサイエンティスト9年)を経て2017年4月から現職 • データサイエンティスト協会(前事務局長)やデータサイエンティスト育成の新 規事業の立ち上げ • 電通大、滋賀大、慶應SFC、立教大など大学や官公庁での講義や講演・執筆 など E-Mail [email protected] Socialアカウント https://www.facebook.com/hashimoto.takehikko / @takenotabi 6

Slide 7

Slide 7 text

講師紹介:福中 公輔 氏名 福中 公輔(ふくなか こうすけ) 所属 ㈱   シニア・データサイエンティスト キャリア サマリ 早稲田大学にて、統計学やデータ解析、テスト理論の研究を行った後、実務へ の応用に興味を持ち、データサイエンティストとなる。学校法人産業能率大学総 合研究所に在籍時は、企業内のデータサイエンティスト育成支援、データ解析 支援、データ解析プロジェクトのコンサルティング等に従事。一般社団法人デー タサイエンティスト協会が主催するデータサイエンスアワードにて、 年度、東 京メトロとのプロジェクト「データサイエンスと働き方改革」で最優秀賞を受賞。こ れまでにデータ活用による業務効率化の仕組みに関する特許を 件取得。 E-Mail [email protected] URL https://uca-works.com/ 7

Slide 8

Slide 8 text

アイスブレイク! お隣の席の方と相互に 自己紹介を 1分ずつお願いします! 8

Slide 9

Slide 9 text

Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5. 参考文献 9

Slide 10

Slide 10 text

ケーススタディ:新しいエリア探し ● 友人から気分一新で新しいエリアで暮らそうと考えていると相談を受けました。せっ かくの機会ですので、できるだけよいエリアに家を買いたいなと言っています。 ● 現在、勉強中のデータサイエンスを活用して、よいエリア(≒地域、場所)の提案に チャレンジしてみましょう! 10

Slide 11

Slide 11 text

PPDACとは? 出典:なるほど統計学園高等部(総務省統計局) https://www.stat.go.jp/koukou/howto/process/index.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 「データに基づく問題解決のプロセス」 11

Slide 12

Slide 12 text

Problem:ケース Q:いいエリアとは? 12

Slide 13

Slide 13 text

Problemとは ● 明確化 ○ 問題はなにか、目的はなにか、目標はなに か、etc ● 定量化 ○ 数字で計測できるように定義 ■ NG:おしゃれなエリア ■ OK:ブランド店が多いエリア 一言でいうと「問題の明確化と定量化」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 13

Slide 14

Slide 14 text

Problem:ケースの回答例 Q:いいエリアとは? A:「便利」で「安い」エリア 14

Slide 15

Slide 15 text

Planとは ● 問題に対し ○ 必要な素材を考え(≒データ) ○ どう調理するか(≒分析) を描く ● (筋のよい)仮説を持つことが大切 一言でいうと「分析の設計」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 15

Slide 16

Slide 16 text

Plan:ケース Q:「便利」で「安い」エリア  必要な素材(データ) 調理(分析) ● ● 16

Slide 17

Slide 17 text

Plan:ケースの回答例 Q:「便利」で「安い」エリア  必要な素材(データ) 調理(分析) (便利) ● 駅数・路線数、駅距離 ● コンビニ店舗数、病院数、 etc (安い) ● 地価、家賃、物価、etc ● 他エリアとの比較 ● 過去の傾向(推移)、 etc 17

Slide 18

Slide 18 text

Dataとは ● 問題に対し必要な素材が手元に揃っているこ とは基本ない ● 必要な素材を ○ どう収集するか ○ (分析しやすいよう)どう加工するか 手間と時間がかかるが大事 一言でいうと「(必要な素材(≒データ)の)収集と加工」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 18

Slide 19

Slide 19 text

Data:利用データ 出典:国土交通省 地価公示 http://www.mlit.go.jp/totikensangyo/totikensangyo_fr4_000043.html 【概要】 ● 国土交通省の地価公示データを主に利用(+オープンデータ) ● 都心5区の20年分のデータを抽出、加工 【項目】 ※詳細別紙参照 出典:あおぞら不動産 オフィス検索サイト https://aozora-estate.com/post-office-magazines/107/ 19

Slide 20

Slide 20 text

Analysisとは ● 現状把握(1つのデータ) ○ 代表値や可視化により、 各変数の現状を把握 ● 関係調査(2つのデータ間) ○ 比較と傾向の観点で、 変 数間の関係を調査 一言でいうと「現状を把握し、関係を調査」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 出典:社会人のためのデータサイエンス演習(総務省 統計局) 20

Slide 21

Slide 21 text

Analysis:代表値と分布による現状把握 出典:社会人のためのデータサイエンス演習(総務省 統計局) 21

Slide 22

Slide 22 text

Analysis:変数間の関係探索 出典:社会人のためのデータサイエンス演習(総務省 統計局) 22

Slide 23

Slide 23 text

Conclusion ● 統合とは ○ PPDAを踏まえ、問題に 対し結論を提示 ○ 結論が出ない場合、  必要なプロセスに戻る ● 新たな問題から次のサ イクルへ 一言でいうと「(各プロセスの)統合」 出典:チャンス発見の情報技術 https://www.tdupress.jp/book/b349879.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 23

Slide 24

Slide 24 text

Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5. 参考文献 24

Slide 25

Slide 25 text

ケーススタディ:新しいエリア探し(30分) ● 友人から気分一新で春先から新しいエリアで暮らそうと考えていると相談を受けました。せっかくの機会で すので、できるだけよいエリアに家を買いたいなと言っています。 ● 現在、勉強中のデータサイエンスを活用して、よいエリア(≒地域、場所)の提案にチャレンジしてみましょ う! ○ 5つのエリアの地価公示データをもとに、よいエリア提案を 2人一組で考えてください。 ○ 必要に応じて外部データや情報を加味して OKです。 25

Slide 26

Slide 26 text

ケーススタディ:記入Format(30分) (ターゲットを設定(男女 単身 ファミリー)した上で) 「便利」で「安い」おすすめエリアは? Problem 「便利」 駅・路線や店舗、公共施設や病院が多い(比較) 「安い」 地価が低い(比較)、地価の上昇が見込める(傾向) Plan 都心 区の地価公示データ( 年分)  ※他のデータがあれば追記 Data 参考にした 表・グラフ グラフの解釈 Anaysis ◯◯区 Conclusion 表・グラフ 解釈 表・グラフ 解釈 表・グラフ 解釈 26

Slide 27

Slide 27 text

Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5. 参考文献 27

Slide 28

Slide 28 text

アイスブレイク!(不動産会社社員の回答例) 28

Slide 29

Slide 29 text

不動産領域におけるデータサイエンス事例紹介 物件の価格って どうやって決まるの? 29

Slide 30

Slide 30 text

不動産領域におけるデータサイエンス事例紹介 経験豊富なエージェントが1件1件査定しています 30 【お客様】 時間をかけずもっと早 く知りたい! 【エージェント】 負荷が高く、大変!

Slide 31

Slide 31 text

No content

Slide 32

Slide 32 text

過去の物件情報をもとに自動査定するAIを開発 32 32 所在階 総階数 住所 竣工年 物件名 この物件は  3200万円~3800万円 だと予測 ヒストグラムや散布図など基礎的な分析は初期の段階で必ず行っています!

Slide 33

Slide 33 text

エントリー層のみなさまへのメッセージ 論よりRun 33

Slide 34

Slide 34 text

Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(75分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5. 参考文献 34

Slide 35

Slide 35 text

参考文献 今回の登壇資料での紹介含め、主にエントリー層向けの参考情報 ● なるほど統計学園高等部 - 総務省統計局 https://www.stat.go.jp/koukou/ ● 社会人のためのデータサイエンス演習 https://lms.gacco.org/courses/course-v1:gacco+ga063+2019_05/about ● 統計検定 3級 http://www.toukei-kentei.jp/about/grade3/ ● データサイエンティスト協会 DSSJournal お役立ちリンク https://www.datascientist.or.jp/dssjournal/link/ 35