Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
(JSAI2020)賃料推定AIを活用した 相場比較タグの開発と ユーザーへの提示効果の検証/...
Search
大浜毅美
June 10, 2020
Science
130
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
(JSAI2020)賃料推定AIを活用した 相場比較タグの開発と ユーザーへの提示効果の検証/JSAI2020-AI-Real-Estate-Estimator
大浜毅美
June 10, 2020
Other Decks in Science
See All in Science
データベース02: データベースの概念
trycycle
PRO
2
1.2k
データベース09: 実体関連モデル上の一貫性制約
trycycle
PRO
0
1.2k
機械学習 - pandas入門
trycycle
PRO
0
610
Bリーグのショットデータを活用した得点期待値モデルの構築 / Construction of expected points model using shot data of B.LEAGUE
konakalab
0
140
見上公一.pdf
genomethica
0
150
AI bij literatuuronderzoek in de wetenschap
voginip
0
170
医療 LLM ベンチマークの現在地:多面的評価 と日本ローカライズ
analokmaus
1
500
Physical AIを支えるWeights & Biases
olachinkei
1
370
ITTF卓球世界ランキングのポイント比を用いた試合結果予測モデルの性能評価 / Performance evaluation of match result prediction models using the point ratio of the ITTF Table Tennis World Ranking
konakalab
0
130
イロレーティングを活用した関東大学サッカーの定量的実力評価 / A quantitative performance evaluation of Kanto University Football Association using Elo rating
konakalab
0
270
HDC tutorial
michielstock
2
700
CVPR2026_VGGTとその仲間たち
mickey_0226
0
790
Featured
See All Featured
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
The untapped power of vector embeddings
frankvandijk
2
1.8k
From π to Pie charts
rasagy
0
200
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
840
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
How GitHub (no longer) Works
holman
316
150k
Abbi's Birthday
coloredviolet
2
8k
Docker and Python
trallard
47
3.9k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
420
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Transcript
賃料推定AIを活用した 相場比較タグの開発と ユーザーへの提示効果の検証 2020年度 人工知能学会全国大会 (第34回)
2
3 不動産仲介IT化の試み – ietty「対話型eコマース」 チャットセンター (手動) 人工知能 (チャットボット) 質問 物件評価
希望条件 転居時期 物件提案 物件提案 回答 入居希望者 「徒歩0秒の不動産屋さん」 ietty 内見・契約 自社営業 業務委託 会社 web上の来店カード web上の接客カウンター • 「接客」と「物件のご紹介」をチャットで行う • 店舗を持たずに仲介業の前半部分をオンライン化する • 随所にAIを活用することで、オペレーションの自動化を図る 原則すべて自社システムで完結。
本研究の課題と目的 モデル構築 実戦投入 まとめ 4
5 機械学習と不動産 米国ではZillow(不動産情報)とRedfin(ブローカー/エージェント)という2大 プレーヤーがAIを活用した価格査定で躍進。
6 日本のAI価格推定システム 売買価格推定 賃料推定
7 不動産投資のためのAI iettyでも賃料推定システム「Room Analytics」を2019年7月にリリース。 売る側、貸す側のAI。
8 本研究の目的 借りる人のためのAI。 ユ ー ザ ー
本研究の課題と目的 モデル構築 実戦投入 まとめ 9
カテゴリ型 路線名 駅名 契約形態 管理会社ID 部屋の向き … 数量値型 専有面積 礼金
間取り 保証金 築年数 情報登録日 情報更新月 敷金 最高階 契約年数 階数 駅徒歩 … bool型 駐輪場 フローリング 南向き 収納スペース CATV 都市ガス 二人入居可 洗濯機置場有り システムキッチン 温水洗浄便座 モニタ付きインターホン 追い焚き機能 オートロック ガスコンロ可 バス・トイレ別 … iettyが2015年から蓄積する265万物件を288変数で表現。 6万円〜100万円までのマンション・アパートに対して学習 特徴量選定 *内10%(26.5万件)の物件を精度検証用として取り置き
LightGBMによる「賃料+共益費」を目的変数とする学習モデルを構築 学習モデル構築 乖離率中央値(median error rate: MER)=0.017(1.7%) 決定係数(R2)=0.983 https://blog.shoby.jp/entry/2019/08/01/010019 参考)海外含む他社の精度をまとめたblogがこちら *
但し売買価格と賃料では基準や価格流動性が異なることに注意
Redfin/Zillowでは、Median Error rate(乖離率中央値)と誤差5-20%に含ま れる物件の割合を資料として明記している。平均で概ね1.7%〜2.4% 乖離率と乖離率中央値 https://www.redfin.com/redfin-estimate https://www.zillow.com/zestimate/
Redfin / Zirrowが開示している指標を算出。 売買と賃貸の違いがあるため単純比較できないが、傾向は類似している。 乖離率と乖離率中央値 23区の2019年1月以降掲載物件の乖離率中央値と比率、最大値 MER within_5% within_10% within_20%
max 練馬区 1.54% 83.0% 94.9% 99.3% 561.8% 目黒区 1.62% 80.8% 93.0% 99.0% 207.3% 墨田区 1.30% 84.2% 95.0% 99.1% 183.6% 北区 1.50% 82.6% 94.6% 99.2% 233.1% 豊島区 1.53% 80.9% 92.9% 99.1% 386.6% 文京区 1.57% 79.9% 93.3% 98.7% 103.0% 品川区 1.48% 82.0% 94.0% 99.2% 106.4% 板橋区 1.52% 83.1% 94.5% 98.7% 52.6% 中野区 1.69% 80.3% 93.5% 99.1% 86.4% 中央区 1.23% 83.0% 93.8% 99.0% 72.5% 大田区 1.54% 83.1% 95.0% 99.3% 296.0% 台東区 1.21% 83.4% 94.2% 99.1% 74.6% 足立区 1.51% 82.3% 95.1% 99.3% 152.1% 千代田区 1.41% 77.6% 87.9% 97.1% 136.9% 世田谷区 1.59% 81.6% 94.2% 99.2% 80.0% 杉並区 1.69% 80.2% 93.5% 99.2% 187.4% 新宿区 1.45% 81.2% 92.8% 98.8% 138.3% 渋谷区 1.41% 80.2% 92.1% 98.2% 353.1% 荒川区 1.24% 84.7% 94.5% 99.2% 315.2% 港区 1.28% 79.6% 90.7% 97.3% 162.8% 江東区 1.29% 83.4% 93.8% 98.8% 388.2% 江戸川区 1.56% 82.8% 94.9% 99.1% 100.3% 葛飾区 1.46% 82.2% 94.9% 99.3% 82.7%
面積、最寄り駅、駅徒歩、築年などの物件探しで重要となる情報の他、 管理会社、募集時期など付加的な情報も高い値を示した。 有効な特徴量 次ページより、 データクレンジングと特徴量エンジニアリングの一部を紹介
入力のミスは必ずあることを前提に、 SQLや単回帰、重回帰で異常を検知し、目視確認の後修正。 データクレンジング ietty 入力ミスチェッカー
マイソク(図面)レベルでの誤りの他、棟貸し・店舗用などが紛れ込むことも データクレンジング 2LDK 259.3m2! 社宅用1棟貸物件 気が付かず学習に利用すると 近隣の賃料予測値が壊滅。 丁寧に取り除く。 居室25畳なので、 本来50〜60m2ぐらい
景気・地価変動などの要因により賃料も時系列変化。 募集開始日を月単位の粒度で投入することで大きく精度が向上 特徴量エンジニアリング 1R〜2DKの平均賃料時系列変化
間取りは「1R」「2LDK」などの部屋数+記号で表現される。 カテゴリとして投入することも可能だが、 記号部分を数量値化することでさらに精度を高めた。 特徴量エンジニアリング 記号 英語表記 意味 係数 R Room
居住用ではほぼ「1R(ワンルーム)」でしか利用されない -0.6 K Kitchen 居室数+キッチン。DKやLDKに比べてbed roomが実質1つ減る -0.3 DK Dining キッチンのある部屋が5-8帖(1DK)または6-10帖(2DK以上) 1.0 LDK Living キッチンのある部屋がDKの基準値以上 1.5 例) リビング1+寝室1となる間取り 2K = 2-0.3 = 1.7 1DK = 1+1.0 = 2.0 1LDK = 1+1.5 = 2.5 リビング1+寝室2となる間取り 3K = 3-0.3 = 2.7 2DK = 2+1.0 = 3.0 2LDK = 2+1.5 = 3.5
2019年にiettyのDBに1件以上の物件が登録された管理会社は17,885事業所 うち1万件以上の物件が登録されたのは9社のみの超ロングテイル濫立市場 しかし、賃料の査定は管理会社ごとに特色があり、AIとしての重要度は高い 「電話番号」をIDとして事業所単位を特徴量とすると、最も精度が上がる 特徴量エンジニアリング 管理会社と2019年度登録物件数 0 5000 10000 15000
20000 25000 30000 35000 40000 1 39 77 115 153 191 229 267 305 343 381 419 457 495 533 571 609 647 685 723 761 799 837 875 913 951 989 1027 1065 1103 1141 1179 1217 1255 1293 1331 1369 1407 1445 1483 1521 1559 1597 1635 1673 1711 1749 1787 1825 1863 1901 1939 1977 2015 2053 2091 2129 2167 2205 2243 2281 2319 2357 2395 2433 2471 2509 2547 2585 2623 2661 2699 2737 2775 2813 2851 2889 2927 2965 3003 3041 3079 3117 3155 3193 3231 3269 3307 3345
賃貸の募集では、オーナーや管理会社の意向により住所をあえて住宅番号 や地番まで開示していないことも多い。 特徴量エンジニアリング(論文提出後の追加研究) Google Maps Platformを利用し、緯度経度を 取得すると同時に、住所の記載レベルを推定 レベル 意味 出現率
ROOFTOP 家屋特定 71.4% GEOMETRIC_CENTER 街区レベルの幾何学中心 8.4% APPROXIMATE 丁目レベルまたは概算値 20.2% 記載レベルと座標を元に、 名寄せやジオデモグラフィーデータを特徴量に。 ゼンリン Chomonicx 4.0 による地域クラスタ
本研究の課題と目的 モデル構築 実戦投入 まとめ 21
22 リアルタイム推定システムの開発 物件情報入手とほぼ同時に賃料の推定を行う推論システムを導入。 実際の「賃料+共益費」との比率を「お借り得RATE」として指標化 お借り得rate = 推定賃料 募集賃料
「お借り得RATE」は概ね左右対称(若干>1寄り)の分布となる。 リアルタイム推定システムの予測誤差率分布 2020年5月募集開始物件のお借り得rate分布 0 200 400 600 800 1000 1200
1400 1600 0.506 0.533 0.561 0.59 0.614 0.632 0.651 0.668 0.686 0.699 0.71 0.722 0.732 0.742 0.753 0.763 0.773 0.783 0.793 0.803 0.813 0.823 0.833 0.843 0.853 0.863 0.873 0.883 0.893 0.903 0.913 0.923 0.933 0.943 0.953 0.963 0.973 0.983 0.993 1.003 1.013 1.023 1.033 1.043 1.053 1.063 1.073 1.083 1.093 1.103 1.113 1.123 1.133 1.143 1.153 1.163 1.173 1.183 1.193 1.203 1.213 1.223 1.233 1.244 1.254 1.264 1.274 1.286 1.3 1.313 1.328 1.343 1.36 1.378 1.395 1.413 1.45 1.488 1.538
24 お部屋探しアプリ「ietty」への導入 iettyアプリでは、お借り得rateを元に [相場よりお得]タグを付与し、 ユーザの相場判断の一助とした。
25 お部屋探しアプリ「ietty」への導入 2019年11月に物件の特徴をタグ表示する「タグ付与機能」をリリース。 前後1ヶ月の[相場よりお得・超お得]該当物件の「内見する」評価を比較 2.11% 2.41% 2.30% 2.77% 0.00% 0.50%
1.00% 1.50% 2.00% 2.50% 3.00% リリース前 リリース後 相場並み 相場以上 0.19 0.36 「タグ」の効果で全体的に評価が向上しているが、 「相場よりお得」タグによりお得な物件の内見可能性がより高まっている。 (提案総数)n=484,897
26 お部屋探しアプリ「ietty」への導入 アプリ内の「みつける」機能では賃料推定順の「相場よりお得順」、 新着順や希望との乖離と賃料推定値を重み付けした「おすすめ順」の 2つにお借り得RATEを利用。
27 お部屋探しアプリ「ietty」への導入 初期表示は「新着順」に設定しているが、内見評価に至る確率は 「相場よりお得順」が最も高い。 「みつける」機能並び順別の効果
まとめ iettyアプリにAIの成果を導入することにより 「内見したい」アクションが増加 AIがユーザの物件選びに寄与できた。
展望 機械学習による賃料推定は今後より一般的になっていくことが予想される。 による対等な取引の実現を目指す。 借りる人のためのAI。 ユ ー ザ ー