Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ITエンジニアのための住所システムのお話
Search
Takayuki Miyauchi
October 22, 2020
Technology
0
140
ITエンジニアのための住所システムのお話
和歌山のITコミュニティ Wacker で発表したスライドです。
Takayuki Miyauchi
October 22, 2020
Tweet
Share
More Decks by Takayuki Miyauchi
See All by Takayuki Miyauchi
データ連携基盤としてのベクトルタイル
miya0001
1
190
不動産に関連しそうなデータもろもろ
miya0001
0
64
Geolonia Maps for SmartCity
miya0001
0
690
ベクトルタイルで見えてきたデジタル地図の未来
miya0001
0
260
不動産IDの仕組みと今後の課題
miya0001
0
290
オープンソースでつくるオープンソースっぽい地図の会社の挑戦
miya0001
0
260
TileCloudの裏側
miya0001
0
340
地方の子供たちを宇宙へ! きのくにICT教育
miya0001
1
270
ホスティングの立場からのWordPressへの貢献と協力
miya0001
0
1.1k
Other Decks in Technology
See All in Technology
【若手エンジニア応援LT会】ソフトウェアを学んできた私がインフラエンジニアを目指した理由
kazushi_ohata
0
120
3次元点群データ「VIRTUAL SHIZUOKA』のオープンデータ化による恩恵と協働の未来/FOSS4G Japan 2024
kazz24s
0
140
AWS Media Services 最新サービスアップデート 2024
eijikominami
0
110
【令和最新版】AWS Direct Connectと愉快なGWたちのおさらい
minorun365
PRO
5
660
State of Open Source Web Mapping Libraries
dayjournal
0
240
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.8k
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
170
SREの組織類型に応じた リーダシップの考察
kenta_hi
PRO
1
650
障害対応指揮の意思決定と情報共有における価値観 / Waroom Meetup #2
arthur1
5
420
AIチャットボット開発への生成AI活用
ryomrt
0
150
Python(PYNQ)がテーマのAMD主催のFPGAコンテストに参加してきた
iotengineer22
0
300
いろんなものと両立する Kaggleの向き合い方
go5paopao
2
1.1k
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Fireside Chat
paigeccino
33
3k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.8k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.8k
GitHub's CSS Performance
jonrohan
1030
460k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
42
9.2k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
Typedesign – Prime Four
hannesfritz
40
2.4k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Thoughts on Productivity
jonyablonski
67
4.3k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
Transcript
ITエンジニアのための 住所システムのお話 株式会社 Geolonia https://geolonia.com/ 宮内 隆行 2020/10/18 1 1
先日イケてるベンチャー企業の Geolonia が 住所データを公開してとても話題になりました。 • 最大10万PV/日以上の閲覧 • はてなブックマークで累計3,000以上 • 日経新聞、TechCrunch、InternetWatch
など多くのメディアで紹介 2 おかげさまでこの2ヶ月間で64件の政府 関係、自治体、大学、企業、団体の皆様 からのお問い合わせをいただきました。
なんで公開したの? • おもしろそうだと思ったから。。。 • 公開することで実現できそうなもっと大きな未来が見えたから。 3
なぜそんなに話題になったの? 住所というのはベースレジストリと呼ばれる社会の基本台帳の一つ。 • 購入すれば500万円/年以上の費用がかかるデータ。 • ありとあらゆるデータがこれにつながる。 4
住所はコンピューターにとってとても扱いが難しい データのひとつ • 「1丁目1番1号」 = 「一丁目一番一号」 = 「1-1-1」 などに代表される揺れ •
京都の「通り名」に代表される多様なシステム 5 自然言語処理と 言えるほどの複雑さ
それでもよくできたシステムなのかも • 京都の通り名、札幌の「条」システム、堺市の「丁」システムなど、地方自治体ごとに 多様なシステムが存在しながらも、とりあえず機能している。 • 宅急便とか郵便が無事に届かないことをあまり心配したことないですよね? 6 海外と比べて悪い仕組みというわけではない。 (むしろよくできているのでは?)
日本には2つの住所システムがあることに 気づいてました? 7 目的 例 地番住所 土地を指す住所 ◦◦市◦◦町◦◦番地 住居表示住所 住居を指す住所
◦◦市◦◦丁目◦◦番◦◦号 • 例えば法務局の登記簿に記載されている住所は地番住所。 • 郵便の宛先として使う住所は住居表示住所。 • 住居表示住所を導入していない自治体もある。 • 「Geolonia 住所データ」がカバーしているのは住居表示住所のみ。
なんでそんなことに? • そもそも住所という仕組みは GPS の衛星が飛び回る前の時代から存在している。 • 土地と建物の関係は必ずしも 1:1 とは限らない。 8
• 左の例では、▪ が地番住所の境界で、 ▪が 住居住所の境界。 • このように複数の地番をまたがる住居や、 ひとつの地番を共有する住居がありえる。 わかりやすくするためにかなり大雑把な説明です。 ちなみに地番住所の区画のひとつひとつは「筆」という単位を使用します。 「筆」は土地の売買等によって合体したり分割されたりすることがあり、それぞれ「合筆」「分筆」と呼ばれ、それによっ て地番住所が変更されます。
システム上の問題点 住所はプログラマーが期待するような一意なシステムではない。 • 住人が引っ越していなくても、住居住所の整備による変更が起こりうる。 ◦ たとえば東京都町田市では町ごとに順次住所の整理を行っている。 (例)町田市△△町1234番地56 → 町田市〇〇〇一丁目〇番〇号 ◦
ビフォーアフターを予測することが困難な変更であり、たとえば正規表現等による置換等でどうにか なる問題ではない。 • 文字列としての「ゆれ」以外にも、「住居表示」か「地番」かによる「ゆれ」が生じる。 ◦ たとえば建築確認申請等で誤って住居住所が入力されるなど。 9
目的地は本当にそこか?問題 • たとえば自動運転車で〇〇大学を目的地とした場合、ほんとうに目指すべき場所 は、指定された住所ではなく「その場所にいくのに便利そうな駐車場」である。 • 一方で住居表示住所は建物につくものなので、駐車場には住所がない。 • 緯度経度も完璧ではない。 ◦ 住所ではあいまいすぎるが、緯度経度ではピンポイントすぎで、緯度経度で指定された点を含む特
定のエリア内を指すなにかが必要。 10 ドローン配送や自動運転車において、 ラストワンマイルの実装が困難。
ローマ字/英語表記問題 いろいろ混乱はあるが、アプリケーションの国際化では、国土地理院にならい「ヘボン 式」でいい気がする。。。(たぶん) • だけど Minami-Alps (南アルプス市) という例外もあるので、なんでもかんでもロー マ字に変換すればすむわけではなさそう。。。 •
「東京都港区」は「Minato city, Tokyo」だけど「大阪市港区」は「Minato ward, Osaka」などのように東京23区だけは別扱いだったりする。 参考: 国土地理院「地名等の英語表記規定」 https://www.gsi.go.jp/common/000138865.pdf 11
「ゆれ」問題 OCR などによる誤認識も考慮に入れると修羅場。 • カタカナの「ニ」と漢数字の「二」や、「ハ」と「八」など • 「巿」(ふつ)と「市」(いち) • 新字体と旧字体、JIS第2水準と第1水準 •
「塩竈市」と「塩釜市」、「埠頭」と「ふ頭」、「藪」と「薮」など • 「ケ」と「ヶ」、「カ」と「ヵ」、「ノ」と「の」など 12
住所に関連する Geolonia の取り組み • 特定の地図サービスへのロックインがなく地番住所にも対応したジオコーダーの整 備。 ◦ 様々な企業や団体と連携してのデータ集め。 • 住居住所
⇔ 地番住所の相互変換を実現するための様々なアクション ◦ 政府、自治体、関係団体との交渉など。 • 住所の変更をトラッキングするためのシステム開発。 ◦ 新旧住所の変換 ◦ 住所の正規化エンジンの開発 13 たとえばこれらの課題を解決して不動産IDを実現するだけでも、 経済効果が数千億円以上と言われています。
開発における戦略 • 無料版をオープンソースで公開して、コミュニティのみなさんと数年かけて育ててい きたい。 ◦ 住所マスター ◦ 住所正規化エンジン ◦ ジオコーダー
• エンタープライズ向けには当面の間、パートナー企業のみなさんと連携し有料版 として提供。 • 政府や自治体がオープンデータ化してくれればもっとうれしいけど、じっと待たなく てもなにかしら前には進められる気がする。。。 14
ありがとうございました! 15