$30 off During Our Annual Pro Sale. View Details »

文章のなかの地理空間 - 地理空間情報科学(GIS)と自然言語処理(NLP)の融合へ向けて -

Hiroki Ouchi
September 12, 2022

文章のなかの地理空間 - 地理空間情報科学(GIS)と自然言語処理(NLP)の融合へ向けて -

MIERUNE Meetup mini #4( https://mierune.connpass.com/event/257222/ )で使用した発表スライド(一部修正版)

Hiroki Ouchi

September 12, 2022
Tweet

More Decks by Hiroki Ouchi

Other Decks in Research

Transcript

  1. ⼤内 啓樹
    MIERUNE Meetup mini #4 2022/09/08
    奈良先端科学技術⼤学院⼤学 ⾃然⾔語処理学研究室 助教
    ⽂章のなかの地理空間
    − 地理空間情報科学(GIS)と⾃然⾔語処理(NLP)の融合へ向けて −
    [email protected]

    View Slide

  2. 2021年8⽉中旬のある夜
    科研費申請のための研究テーマを模索中
    2
    n 「おくのほそ道」 でググったら以下のページがヒット
    http://www.basho-bp.jp/?page_id=28

    View Slide

  3. そこには「地図」と「⽂章」が並置されていた
    芭蕉からの贈りもの
    3
    計算機によって
    「⽂章」を読解し
    「地図」と結びつける
    着想は松尾芭蕉から授かった
    http://www.basho-bp.jp/?page_id=28
    ⾔葉によって地図を
    もっと豊かにできるはず

    View Slide

  4. Geographic
    Trajectory
    Grounding
    科研費 基盤研究(B)
    「 ⽂ 章 中の ⼈物 の移 動軌跡 を
    実 世 界の 地 図上 に 接 地 する
    た め の基 礎 研究 と そ の 応⽤ 」
    研究代表者 ⼤内啓樹
    研究分担者 進藤裕之,若宮翔⼦,松⽥裕貴
    研究協⼒者 東⼭翔平,⼤友寛之,⼭本和太郎,
    井⼿佑翼,⽮⽥竣太郎,品川政太郎,
    井之上直也,荒牧英治,中村哲,
    上垣外英剛,渡辺太郎

    View Slide

  5. ⽬標
    「地理空間情報×⾃然⾔語処理」を開拓
    5
    n 地理と⾔語が交差する新たな研究開発領域を開拓する
    n 仲間を集めてオープンに知⾒・成果物を共有する「場」を作る
    Ø 「地理と⾔語」のコミュニティの創出
    n 産学官で連携して幅広い社会的インパクトをねらう
    n 「地理と⾔語」の最先端技術を駆使したアプリ・OSSの開発
    n ⾃治体と連携して観光・防災など「地理」関連分野から地域貢献
    新たなムーブメントは⽇本から

    View Slide

  6. 我々が取り組む主なタスク
    移動軌跡接地問題
    6
    出⼒:移動軌跡の描画
    午前8時 近鉄奈良駅 到着。
    ホテルニューわかさに
    9時 チェックイン予定。
    時間に余裕があったので、
    途中のスタバで ⼀服。
    30分過ごしてから 店を出て、
    ホテルにチェックインしました。
    ⼊⼒:⽂章
    近鉄奈良駅
    スターバックス
    奈良公園店 2
    1
    ホテル
    ニューわかさ
    3
    n ⽂章中の著者が辿った軌跡を読み取り地図上に再構成
    Ø 軌跡 = POI (Point Of Interest) の系列

    View Slide

  7. 移動軌跡接地問題の特徴
    複合的な処理が必要となる
    7
    n 各 POI の認識
    Ø 固有表現抽出
    n 同⼀の POI を指す表現の認識
    Ø 共参照解析
    n 各 POI を訪問したか否かの判定
    Ø 事実性/モダリティ解析
    n 各 POI を地図上に接地
    Ø エンティティ解析
    n POI の訪問順序の認識
    Ø 時間順序解析
    このあたりで特に
    GISとNLPが交わる
    午前8時 近鉄奈良駅 到着。
    ホテルニューわかさに
    9時 チェックイン予定。
    時間に余裕があったので、
    途中のスタバで ⼀服。
    30分過ごしてから 店を出て、
    ホテルにチェックインしました。
    Visit
    MoveTo
    Visit
    Visit
    Visit




    ⼊⼒:⽂章
    各処理のためのツールを開発して⼀般公開をめざす

    View Slide

  8. 移動軌跡接地問題の技術的チャレンジ
    地図上の正しいPOIにプロットできるか
    8
    ⽂章中の「⽂脈」と地図上の「位置関係」を同時に考慮したいところ
    午前8時 近鉄奈良駅 到着。
    ホテルニューわかさに
    9時 チェックイン予定。
    時間に余裕があったので、
    途中のスタバで ⼀服。
    30分過ごしてから 店を出て、
    ホテルにチェックインしました。
    Visit
    MoveTo
    Visit
    Visit
    Visit




    ⼊⼒:⽂章
    近鉄奈良駅
    スターバックス
    猿沢池店
    スターバックス
    奈良公園店
    ホテル
    ニューわかさ
    へ⾄る道
    どちらのスタバ?

    View Slide

  9. 本プロジェクトの簡単な計画
    3つの中間課題
    9
    ① データセット構築
    • システムの学習・評価のためのデータセットを構築
    • (学術研究機関に)無料で公開予定
    ② システム開発
    • 「⾔語世界」と「地理空間」の両⽅を考慮したシステムの提案・開発
    • 各種ツールは無料で⼀般公開予定
    ③ アプリケーションへの応⽤
    • 観光ルート推薦アプリなどへ応⽤

    View Slide

  10. コラボレーション募集中
    (研究・開発・雑談・その他)
    [email protected]
    Geography & Language

    View Slide