Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ITエンジニアのための住所システムのお話
Search
Takayuki Miyauchi
October 22, 2020
Technology
0
230
ITエンジニアのための住所システムのお話
和歌山のITコミュニティ Wacker で発表したスライドです。
Takayuki Miyauchi
October 22, 2020
Tweet
Share
More Decks by Takayuki Miyauchi
See All by Takayuki Miyauchi
Geolonia のデータ連携基盤とスマートシティ構想
miya0001
1
260
データ連携基盤としてのベクトルタイル
miya0001
1
250
不動産に関連しそうなデータもろもろ
miya0001
0
100
Geolonia Maps for SmartCity
miya0001
0
850
ベクトルタイルで見えてきたデジタル地図の未来
miya0001
0
320
不動産IDの仕組みと今後の課題
miya0001
0
340
オープンソースでつくるオープンソースっぽい地図の会社の挑戦
miya0001
0
300
TileCloudの裏側
miya0001
0
420
地方の子供たちを宇宙へ! きのくにICT教育
miya0001
1
320
Other Decks in Technology
See All in Technology
【インシデント入門】サイバー攻撃を受けた現場って何してるの?
shumei_ito
0
1.4k
toCプロダクトにおけるAI機能開発のしくじりと学び / ai-product-failures-and-learnings
rince
6
5.2k
顧客の言葉を、そのまま信じない勇気
yamatai1212
1
170
Amazon Bedrock AgentCore EvaluationsでAIエージェントを評価してみよう!
yuu551
0
210
Application Performance Optimisation in Practice (60 mins)
stevejgordon
0
110
無ければ作る! バイブコーディングで作ったものを一気に紹介
tatsuya1970
0
110
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
1
130
15 years with Rails and DDD (AI Edition)
andrzejkrzywda
0
150
3分でわかる!新機能 AWS Transform custom
sato4mi
1
320
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
67k
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
0
830
AI時代、1年目エンジニアの悩み
jin4
1
150
Featured
See All Featured
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
120
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
89
What's in a price? How to price your products and services
michaelherold
247
13k
WENDY [Excerpt]
tessaabrams
9
36k
Into the Great Unknown - MozCon
thekraken
40
2.2k
Raft: Consensus for Rubyists
vanstee
141
7.3k
Google's AI Overviews - The New Search
badams
0
900
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
220
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.9k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
130
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
120
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Transcript
ITエンジニアのための 住所システムのお話 株式会社 Geolonia https://geolonia.com/ 宮内 隆行 2020/10/18 1 1
先日イケてるベンチャー企業の Geolonia が 住所データを公開してとても話題になりました。 • 最大10万PV/日以上の閲覧 • はてなブックマークで累計3,000以上 • 日経新聞、TechCrunch、InternetWatch
など多くのメディアで紹介 2 おかげさまでこの2ヶ月間で64件の政府 関係、自治体、大学、企業、団体の皆様 からのお問い合わせをいただきました。
なんで公開したの? • おもしろそうだと思ったから。。。 • 公開することで実現できそうなもっと大きな未来が見えたから。 3
なぜそんなに話題になったの? 住所というのはベースレジストリと呼ばれる社会の基本台帳の一つ。 • 購入すれば500万円/年以上の費用がかかるデータ。 • ありとあらゆるデータがこれにつながる。 4
住所はコンピューターにとってとても扱いが難しい データのひとつ • 「1丁目1番1号」 = 「一丁目一番一号」 = 「1-1-1」 などに代表される揺れ •
京都の「通り名」に代表される多様なシステム 5 自然言語処理と 言えるほどの複雑さ
それでもよくできたシステムなのかも • 京都の通り名、札幌の「条」システム、堺市の「丁」システムなど、地方自治体ごとに 多様なシステムが存在しながらも、とりあえず機能している。 • 宅急便とか郵便が無事に届かないことをあまり心配したことないですよね? 6 海外と比べて悪い仕組みというわけではない。 (むしろよくできているのでは?)
日本には2つの住所システムがあることに 気づいてました? 7 目的 例 地番住所 土地を指す住所 ◦◦市◦◦町◦◦番地 住居表示住所 住居を指す住所
◦◦市◦◦丁目◦◦番◦◦号 • 例えば法務局の登記簿に記載されている住所は地番住所。 • 郵便の宛先として使う住所は住居表示住所。 • 住居表示住所を導入していない自治体もある。 • 「Geolonia 住所データ」がカバーしているのは住居表示住所のみ。
なんでそんなことに? • そもそも住所という仕組みは GPS の衛星が飛び回る前の時代から存在している。 • 土地と建物の関係は必ずしも 1:1 とは限らない。 8
• 左の例では、▪ が地番住所の境界で、 ▪が 住居住所の境界。 • このように複数の地番をまたがる住居や、 ひとつの地番を共有する住居がありえる。 わかりやすくするためにかなり大雑把な説明です。 ちなみに地番住所の区画のひとつひとつは「筆」という単位を使用します。 「筆」は土地の売買等によって合体したり分割されたりすることがあり、それぞれ「合筆」「分筆」と呼ばれ、それによっ て地番住所が変更されます。
システム上の問題点 住所はプログラマーが期待するような一意なシステムではない。 • 住人が引っ越していなくても、住居住所の整備による変更が起こりうる。 ◦ たとえば東京都町田市では町ごとに順次住所の整理を行っている。 (例)町田市△△町1234番地56 → 町田市〇〇〇一丁目〇番〇号 ◦
ビフォーアフターを予測することが困難な変更であり、たとえば正規表現等による置換等でどうにか なる問題ではない。 • 文字列としての「ゆれ」以外にも、「住居表示」か「地番」かによる「ゆれ」が生じる。 ◦ たとえば建築確認申請等で誤って住居住所が入力されるなど。 9
目的地は本当にそこか?問題 • たとえば自動運転車で〇〇大学を目的地とした場合、ほんとうに目指すべき場所 は、指定された住所ではなく「その場所にいくのに便利そうな駐車場」である。 • 一方で住居表示住所は建物につくものなので、駐車場には住所がない。 • 緯度経度も完璧ではない。 ◦ 住所ではあいまいすぎるが、緯度経度ではピンポイントすぎで、緯度経度で指定された点を含む特
定のエリア内を指すなにかが必要。 10 ドローン配送や自動運転車において、 ラストワンマイルの実装が困難。
ローマ字/英語表記問題 いろいろ混乱はあるが、アプリケーションの国際化では、国土地理院にならい「ヘボン 式」でいい気がする。。。(たぶん) • だけど Minami-Alps (南アルプス市) という例外もあるので、なんでもかんでもロー マ字に変換すればすむわけではなさそう。。。 •
「東京都港区」は「Minato city, Tokyo」だけど「大阪市港区」は「Minato ward, Osaka」などのように東京23区だけは別扱いだったりする。 参考: 国土地理院「地名等の英語表記規定」 https://www.gsi.go.jp/common/000138865.pdf 11
「ゆれ」問題 OCR などによる誤認識も考慮に入れると修羅場。 • カタカナの「ニ」と漢数字の「二」や、「ハ」と「八」など • 「巿」(ふつ)と「市」(いち) • 新字体と旧字体、JIS第2水準と第1水準 •
「塩竈市」と「塩釜市」、「埠頭」と「ふ頭」、「藪」と「薮」など • 「ケ」と「ヶ」、「カ」と「ヵ」、「ノ」と「の」など 12
住所に関連する Geolonia の取り組み • 特定の地図サービスへのロックインがなく地番住所にも対応したジオコーダーの整 備。 ◦ 様々な企業や団体と連携してのデータ集め。 • 住居住所
⇔ 地番住所の相互変換を実現するための様々なアクション ◦ 政府、自治体、関係団体との交渉など。 • 住所の変更をトラッキングするためのシステム開発。 ◦ 新旧住所の変換 ◦ 住所の正規化エンジンの開発 13 たとえばこれらの課題を解決して不動産IDを実現するだけでも、 経済効果が数千億円以上と言われています。
開発における戦略 • 無料版をオープンソースで公開して、コミュニティのみなさんと数年かけて育ててい きたい。 ◦ 住所マスター ◦ 住所正規化エンジン ◦ ジオコーダー
• エンタープライズ向けには当面の間、パートナー企業のみなさんと連携し有料版 として提供。 • 政府や自治体がオープンデータ化してくれればもっとうれしいけど、じっと待たなく てもなにかしら前には進められる気がする。。。 14
ありがとうございました! 15