和歌山のITコミュニティ Wacker で発表したスライドです。
ITエンジニアのための住所システムのお話株式会社 Geoloniahttps://geolonia.com/宮内 隆行2020/10/1811
View Slide
先日イケてるベンチャー企業の Geolonia が住所データを公開してとても話題になりました。● 最大10万PV/日以上の閲覧● はてなブックマークで累計3,000以上● 日経新聞、TechCrunch、InternetWatch など多くのメディアで紹介2おかげさまでこの2ヶ月間で64件の政府関係、自治体、大学、企業、団体の皆様からのお問い合わせをいただきました。
なんで公開したの?● おもしろそうだと思ったから。。。● 公開することで実現できそうなもっと大きな未来が見えたから。3
なぜそんなに話題になったの?住所というのはベースレジストリと呼ばれる社会の基本台帳の一つ。● 購入すれば500万円/年以上の費用がかかるデータ。● ありとあらゆるデータがこれにつながる。4
住所はコンピューターにとってとても扱いが難しいデータのひとつ● 「1丁目1番1号」 = 「一丁目一番一号」 = 「1-1-1」 などに代表される揺れ● 京都の「通り名」に代表される多様なシステム5自然言語処理と 言えるほどの複雑さ
それでもよくできたシステムなのかも● 京都の通り名、札幌の「条」システム、堺市の「丁」システムなど、地方自治体ごとに多様なシステムが存在しながらも、とりあえず機能している。● 宅急便とか郵便が無事に届かないことをあまり心配したことないですよね?6海外と比べて悪い仕組みというわけではない。 (むしろよくできているのでは?)
日本には2つの住所システムがあることに 気づいてました? 7目的 例地番住所 土地を指す住所 ○○市○○町○○番地住居表示住所 住居を指す住所 ○○市○○丁目○○番○○号● 例えば法務局の登記簿に記載されている住所は地番住所。● 郵便の宛先として使う住所は住居表示住所。● 住居表示住所を導入していない自治体もある。● 「Geolonia 住所データ」がカバーしているのは住居表示住所のみ。
なんでそんなことに?● そもそも住所という仕組みは GPS の衛星が飛び回る前の時代から存在している。● 土地と建物の関係は必ずしも 1:1 とは限らない。8● 左の例では、■ が地番住所の境界で、 ■が住居住所の境界。● このように複数の地番をまたがる住居や、ひとつの地番を共有する住居がありえる。わかりやすくするためにかなり大雑把な説明です。ちなみに地番住所の区画のひとつひとつは「筆」という単位を使用します。「筆」は土地の売買等によって合体したり分割されたりすることがあり、それぞれ「合筆」「分筆」と呼ばれ、それによって地番住所が変更されます。
システム上の問題点住所はプログラマーが期待するような一意なシステムではない。● 住人が引っ越していなくても、住居住所の整備による変更が起こりうる。○ たとえば東京都町田市では町ごとに順次住所の整理を行っている。(例)町田市△△町1234番地56 → 町田市〇〇〇一丁目〇番〇号○ ビフォーアフターを予測することが困難な変更であり、たとえば正規表現等による置換等でどうにかなる問題ではない。● 文字列としての「ゆれ」以外にも、「住居表示」か「地番」かによる「ゆれ」が生じる。○ たとえば建築確認申請等で誤って住居住所が入力されるなど。9
目的地は本当にそこか?問題● たとえば自動運転車で〇〇大学を目的地とした場合、ほんとうに目指すべき場所は、指定された住所ではなく「その場所にいくのに便利そうな駐車場」である。● 一方で住居表示住所は建物につくものなので、駐車場には住所がない。● 緯度経度も完璧ではない。○ 住所ではあいまいすぎるが、緯度経度ではピンポイントすぎで、緯度経度で指定された点を含む特定のエリア内を指すなにかが必要。10ドローン配送や自動運転車において、ラストワンマイルの実装が困難。
ローマ字/英語表記問題いろいろ混乱はあるが、アプリケーションの国際化では、国土地理院にならい「ヘボン式」でいい気がする。。。(たぶん)● だけど Minami-Alps (南アルプス市) という例外もあるので、なんでもかんでもローマ字に変換すればすむわけではなさそう。。。● 「東京都港区」は「Minato city, Tokyo」だけど「大阪市港区」は「Minato ward,Osaka」などのように東京23区だけは別扱いだったりする。参考:国土地理院「地名等の英語表記規定」https://www.gsi.go.jp/common/000138865.pdf11
「ゆれ」問題OCR などによる誤認識も考慮に入れると修羅場。● カタカナの「ニ」と漢数字の「二」や、「ハ」と「八」など● 「巿」(ふつ)と「市」(いち)● 新字体と旧字体、JIS第2水準と第1水準● 「塩竈市」と「塩釜市」、「埠頭」と「ふ頭」、「藪」と「薮」など● 「ケ」と「ヶ」、「カ」と「ヵ」、「ノ」と「の」など12
住所に関連する Geolonia の取り組み● 特定の地図サービスへのロックインがなく地番住所にも対応したジオコーダーの整備。○ 様々な企業や団体と連携してのデータ集め。● 住居住所 ⇔ 地番住所の相互変換を実現するための様々なアクション○ 政府、自治体、関係団体との交渉など。● 住所の変更をトラッキングするためのシステム開発。○ 新旧住所の変換○ 住所の正規化エンジンの開発13たとえばこれらの課題を解決して不動産IDを実現するだけでも、経済効果が数千億円以上と言われています。
開発における戦略● 無料版をオープンソースで公開して、コミュニティのみなさんと数年かけて育てていきたい。○ 住所マスター○ 住所正規化エンジン○ ジオコーダー● エンタープライズ向けには当面の間、パートナー企業のみなさんと連携し有料版として提供。● 政府や自治体がオープンデータ化してくれればもっとうれしいけど、じっと待たなくてもなにかしら前には進められる気がする。。。14
ありがとうございました!15