Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャ...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
GA technologies
October 24, 2019
Technology
1k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャレンジ!
講義資料
GA technologies
October 24, 2019
More Decks by GA technologies
See All by GA technologies
データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャレンジ!_データ・グラフ集
gatech2013
0
990
データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャレンジ!_演習フォーマット
gatech2013
0
1.2k
X-Tech_meetup_#04_データサイエンスで東京メトロの働き方改革〜リアル×デジタルの可能性〜
gatech2013
0
700
X-Tech_meetup_#04_イントロダクション
gatech2013
0
650
X-Tech_meetup_#04_テクノロジーを活用した建設事業者の経営支援
gatech2013
1
610
X-Tech_meetup_#04_建設会社からConTech企業へ事業転換。リアルから湧き出た課題をITで解決。全ては業界のために
gatech2013
0
650
WebDBForum2019_Poster
gatech2013
2
590
X-Tech_meetup_#03_イントロダクション
gatech2013
0
910
X-Tech_meetup_#03_ブロックチェーン・アプリケーションのアーキテクチャ設計と事業化のポイント
gatech2013
0
900
Other Decks in Technology
See All in Technology
Snowflakeと仲良くなる第一歩
coco_se
2
220
MCP Appsを作ってみよう
iwamot
PRO
4
170
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
1
960
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
2
420
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.8k
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
300
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
370
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
1
910
非定型業務をAI slackbotで自動化する ~ 社内要望を自動壁打ちするbotを作った ~/automating-ad-hoc-work-with-ai-slackbot
shibayu36
0
490
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
580
Agentic Web
dynamis
1
180
Platform engineering for developers, architects & the rest of us (AI agents)
danielbryantuk
0
190
Featured
See All Featured
Leading Effective Engineering Teams in the AI Era
addyosmani
9
2k
The Spectacular Lies of Maps
axbom
PRO
1
790
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.3k
Raft: Consensus for Rubyists
vanstee
141
7.5k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
Mind Mapping
helmedeiros
PRO
1
240
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
200
The SEO identity crisis: Don't let AI make you average
varn
0
480
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
The agentic SEO stack - context over prompts
schlessera
0
800
Transcript
データサイエンスで いいエリアの提案にチャレンジ! 一般社団法人データサイエンティスト協会 エントリー層向けセミナー
本日の内容 【学習目標】 • データ分析の一連の流れを体感し、データからストーリーを構築できるように なること 【Contents】(計 90分) 1. 講師紹介/会社紹介(5分) 2.
分析による問題解決のプロセス( 45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介( 10分) 5. 参考文献 2
Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.
参考文献 3
データサイエンティスト協会とは 4
株式会社GA technologies 5 5 設立年月日 2013年 3月 資本金 11億5,544万9,070円 代表取締役
樋口龍 事業内容 • 不動産テック総合ブランド「RENOSY」の運営 • オンライン融資申込・審査手続きシステム 「Mortgage Gateway」の運営 • 「BEST BASHO」や「BLUEPRINT by RENOSY」などのAIやRPAを活用した研究開 発 • 中古マンションのリノベーション設計施工 従業員 344名(2019年4月時点) • 2018/7マザーズ上場、設立5年で売上 200 億のPropTech企業(不動産テック) • セールスなど強力なReal人材が多数在籍 の一方で、エンジニアが全社員の 44%と Technologyとの融合に注力 • 2017/4にAI Strategy Centerを設立(不動産業 界初)。技術顧問は杉山将氏 • AI Strategy CenterのVision「事業全体を見 据えて行動を起こせる研究者集団」 ⇒急成長ゆえ課題も多いですが、 Excitingな環境です! Let’s Join us!
講師紹介:橋本 武彦 氏名 橋本 武彦(はしもと たけひこ) 所属 ㈱GA technologies AI Strategy
Center General Manager 電気通信大学 客員准教授 キャリア サマリ • Sier(エンジニア5年/研究員2年)⇒調査会社(リサーチャー3年)⇒ ブレイン パッド(シニアデータサイエンティスト9年)を経て2017年4月から現職 • データサイエンティスト協会(前事務局長)やデータサイエンティスト育成の新 規事業の立ち上げ • 電通大、滋賀大、慶應SFC、立教大など大学や官公庁での講義や講演・執筆 など E-Mail
[email protected]
Socialアカウント https://www.facebook.com/hashimoto.takehikko / @takenotabi 6
講師紹介:福中 公輔 氏名 福中 公輔(ふくなか こうすけ) 所属 ㈱ シニア・データサイエンティスト キャリア サマリ
早稲田大学にて、統計学やデータ解析、テスト理論の研究を行った後、実務へ の応用に興味を持ち、データサイエンティストとなる。学校法人産業能率大学総 合研究所に在籍時は、企業内のデータサイエンティスト育成支援、データ解析 支援、データ解析プロジェクトのコンサルティング等に従事。一般社団法人デー タサイエンティスト協会が主催するデータサイエンスアワードにて、 年度、東 京メトロとのプロジェクト「データサイエンスと働き方改革」で最優秀賞を受賞。こ れまでにデータ活用による業務効率化の仕組みに関する特許を 件取得。 E-Mail
[email protected]
URL https://uca-works.com/ 7
アイスブレイク! お隣の席の方と相互に 自己紹介を 1分ずつお願いします! 8
Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.
参考文献 9
ケーススタディ:新しいエリア探し • 友人から気分一新で新しいエリアで暮らそうと考えていると相談を受けました。せっ かくの機会ですので、できるだけよいエリアに家を買いたいなと言っています。 • 現在、勉強中のデータサイエンスを活用して、よいエリア(≒地域、場所)の提案に チャレンジしてみましょう! 10
PPDACとは? 出典:なるほど統計学園高等部(総務省統計局) https://www.stat.go.jp/koukou/howto/process/index.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 「データに基づく問題解決のプロセス」 11
Problem:ケース Q:いいエリアとは? 12
Problemとは • 明確化 ◦ 問題はなにか、目的はなにか、目標はなに か、etc • 定量化 ◦ 数字で計測できるように定義
▪ NG:おしゃれなエリア ▪ OK:ブランド店が多いエリア 一言でいうと「問題の明確化と定量化」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 13
Problem:ケースの回答例 Q:いいエリアとは? A:「便利」で「安い」エリア 14
Planとは • 問題に対し ◦ 必要な素材を考え(≒データ) ◦ どう調理するか(≒分析) を描く • (筋のよい)仮説を持つことが大切
一言でいうと「分析の設計」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 15
Plan:ケース Q:「便利」で「安い」エリア 必要な素材(データ) 調理(分析) • • 16
Plan:ケースの回答例 Q:「便利」で「安い」エリア 必要な素材(データ) 調理(分析) (便利) • 駅数・路線数、駅距離 • コンビニ店舗数、病院数、 etc
(安い) • 地価、家賃、物価、etc • 他エリアとの比較 • 過去の傾向(推移)、 etc 17
Dataとは • 問題に対し必要な素材が手元に揃っているこ とは基本ない • 必要な素材を ◦ どう収集するか ◦ (分析しやすいよう)どう加工するか
手間と時間がかかるが大事 一言でいうと「(必要な素材(≒データ)の)収集と加工」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 18
Data:利用データ 出典:国土交通省 地価公示 http://www.mlit.go.jp/totikensangyo/totikensangyo_fr4_000043.html 【概要】 • 国土交通省の地価公示データを主に利用(+オープンデータ) • 都心5区の20年分のデータを抽出、加工 【項目】 ※詳細別紙参照
出典:あおぞら不動産 オフィス検索サイト https://aozora-estate.com/post-office-magazines/107/ 19
Analysisとは • 現状把握(1つのデータ) ◦ 代表値や可視化により、 各変数の現状を把握 • 関係調査(2つのデータ間) ◦ 比較と傾向の観点で、 変
数間の関係を調査 一言でいうと「現状を把握し、関係を調査」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 出典:社会人のためのデータサイエンス演習(総務省 統計局) 20
Analysis:代表値と分布による現状把握 出典:社会人のためのデータサイエンス演習(総務省 統計局) 21
Analysis:変数間の関係探索 出典:社会人のためのデータサイエンス演習(総務省 統計局) 22
Conclusion • 統合とは ◦ PPDAを踏まえ、問題に 対し結論を提示 ◦ 結論が出ない場合、 必要なプロセスに戻る •
新たな問題から次のサ イクルへ 一言でいうと「(各プロセスの)統合」 出典:チャンス発見の情報技術 https://www.tdupress.jp/book/b349879.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 23
Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.
参考文献 24
ケーススタディ:新しいエリア探し(30分) • 友人から気分一新で春先から新しいエリアで暮らそうと考えていると相談を受けました。せっかくの機会で すので、できるだけよいエリアに家を買いたいなと言っています。 • 現在、勉強中のデータサイエンスを活用して、よいエリア(≒地域、場所)の提案にチャレンジしてみましょ う! ◦ 5つのエリアの地価公示データをもとに、よいエリア提案を 2人一組で考えてください。
◦ 必要に応じて外部データや情報を加味して OKです。 25
ケーススタディ:記入Format(30分) (ターゲットを設定(男女 単身 ファミリー)した上で) 「便利」で「安い」おすすめエリアは? Problem 「便利」 駅・路線や店舗、公共施設や病院が多い(比較) 「安い」 地価が低い(比較)、地価の上昇が見込める(傾向)
Plan 都心 区の地価公示データ( 年分) ※他のデータがあれば追記 Data 参考にした 表・グラフ グラフの解釈 Anaysis ◯◯区 Conclusion 表・グラフ 解釈 表・グラフ 解釈 表・グラフ 解釈 26
Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.
参考文献 27
アイスブレイク!(不動産会社社員の回答例) 28
不動産領域におけるデータサイエンス事例紹介 物件の価格って どうやって決まるの? 29
不動産領域におけるデータサイエンス事例紹介 経験豊富なエージェントが1件1件査定しています 30 【お客様】 時間をかけずもっと早 く知りたい! 【エージェント】 負荷が高く、大変!
None
過去の物件情報をもとに自動査定するAIを開発 32 32 所在階 総階数 住所 竣工年 物件名 この物件は 3200万円~3800万円
だと予測 ヒストグラムや散布図など基礎的な分析は初期の段階で必ず行っています!
エントリー層のみなさまへのメッセージ 論よりRun 33
Contents(90分) 1. 講師紹介/会社紹介(5分) 2. 分析による問題解決のプロセス(75分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介(10分) 5.
参考文献 34
参考文献 今回の登壇資料での紹介含め、主にエントリー層向けの参考情報 • なるほど統計学園高等部 - 総務省統計局 https://www.stat.go.jp/koukou/ • 社会人のためのデータサイエンス演習 https://lms.gacco.org/courses/course-v1:gacco+ga063+2019_05/about
• 統計検定 3級 http://www.toukei-kentei.jp/about/grade3/ • データサイエンティスト協会 DSSJournal お役立ちリンク https://www.datascientist.or.jp/dssjournal/link/ 35