Slide 1

Slide 1 text

Introduction to “Using Semantic Technologies in the Railway Domain: The Register of Infrastructure (RINF) System” Sho Okazaki, PhD Scholar, University College London 2025年12月3日 第6回ナレッジグラフ勉強会@オンライン

Slide 2

Slide 2 text

鉄道とセマンティックウェブ研究 (2020年~) International Semantic Web Conference (ISWC) • 2025 (In-Use) • Toledo, Jhon, et al. "Using Semantic Technologies in the Railway Domain: The Register of Infrastructure (RINF) System." • 2021 (In-Use) • Rojas, Julián Andrés, et al. "Leveraging semantic technologies for digital interoperability in the European railway domain." • Bischof, Stefan, and Gottfried Schenner. "Rail topology ontology: A rail infrastructure base ontology." European Semantic Web Conference (ESWC) • 2025 (Industry) • Both, Andreas, et al. "A Domain-Specific Question-Answering System for Railway Data: A Hybrid Approach." 第6回ナレッジグラフ勉強会@オンライン 1

Slide 3

Slide 3 text

論文情報 • タイトル • Using Semantic Technologies in the Railway Domain: The Register of Infrastructure (RINF) System • 投稿先 • ISWC 2025 (In Use Track) • 著者情報 • Toledo, J., Doña, D., Ruckhaus, E., Corcho, O., Aguado, M., Patru, D., Atemezing, G. and Vasilopoulou, P. • マドリード工科大学、欧州鉄道機関 (ERA) • 提案システム • https://data-interop.era.europa.eu/ • DOI • https://doi.org/10.1007/978-3-032-09530-5_23 2 第6回ナレッジグラフ勉強会@オンライン

Slide 4

Slide 4 text

論文を選んだ動機 1. 私自身が鉄道における関連研究を行っている 4 第6回ナレッジグラフ勉強会@オンライン KG若手の会「スターターキット」に 関連記事を投稿しています! 2. 日頃の疑問 オントロジーやナレッジグラフといった“固いAI”は、どこまで実用的なのか? アセットマネジメント: リスク コスト モノ= 資産(アセット) として 利益を最大化する パフォーマンス

Slide 5

Slide 5 text

背景: 欧州鉄道データの課題 複雑な欧州鉄道システム • 多数の鉄道資産が鉄道路線全体に分散 • 複数組織による同時管理 (インフラ管理者、運営者、製造者等) 2019年時点の課題 • 非接続のデータベース群 • テキスト、表データ等 • データ統合が困難 第6回ナレッジグラフ勉強会@オンライン 5

Slide 6

Slide 6 text

ERAの戦略的決定 (2020年) 知識グラフを基盤に • 今後のデータ、レジストリ、仕様の開発において、知識グラフをデフォル ト設定とする • 管理委員会で法的に明文化 メリット • データ相互運用性の向上 • 統合的なデータ管理 • 新しいユースケースの実現 対象 • インフラ (線路、駅、トンネルなど) • 車両形式 第6回ナレッジグラフ勉強会@オンライン 6

Slide 7

Slide 7 text

RINFシステムの全体像 システムの規模 • 3,900万トリプル • 28,000行のRMLマッピング • 400+ SHACLシェイプ • 364,000線路区間, 65,000駅 主要機能 • 検索機能 • 鉄道インフラ要素の検査 • 地図表示 • GeoSPARQLベースの可視化 • 互換性チェック • 車両と路線の適合性確認 第6回ナレッジグラフ勉強会@オンライン 7

Slide 8

Slide 8 text

セマンティック技術スタック ERAオントロジー (OWL) • 約100クラス、600プロパティ • インフラ、車両、ルートブック、ERTMSをモデル化 SHACL シェイプ • 400以上のシェイプでデータ検証 • ドメイン、範囲、ビジネスルールの検証 RML マッピング • 28,000行のマッピング定義 • XML/SQLからRDFへの変換 SPARQL クエリ • データストーリーとして実装 第6回ナレッジグラフ勉強会@オンライン 8

Slide 9

Slide 9 text

システムアーキテクチャ データセット • Amazon S3 • MongoDB 処理 • RMLMapper • SHACL検証 KGデータ • Virtuoso 第6回ナレッジグラフ勉強会@オンライン 9

Slide 10

Slide 10 text

利用状況と成果 登録ユーザー • 国家登録機関: 39 • インフラ管理者: 97 • 鉄道事業者: 1,117 実際の活用事例 • RailNet Europe • キャパシティ評価、計画ツールで使用 • SNCF Réseau & Alstom • 列車の互換性確保とシミュレーション • 複数加盟国の分析チーム • 地図表示・検索機能を活用 第6回ナレッジグラフ勉強会@オンライン 10

Slide 11

Slide 11 text

主要な課題(1):ガバナンス 時間経過で変化するリソースのURI設計 • 課題: • 資産データは将来の計画を含むため、時間によって値が変化 • 解決策: • 正規URI:永続的な識別子 • ハッシュURI:有効期間をエンコード セマンティックアーティファクト間の変更伝播 • 依存関係の追跡と一貫した維持が必要 (現状手動) 第6回ナレッジグラフ勉強会@オンライン 11 オントロジー RMLマッピング SHACLシェイプ SPARQL

Slide 12

Slide 12 text

主要な課題(2):パフォーマンス SPARQL クエリの最適化 • 問題:車両の互換性チェックで大量のクエリ実行 • 対策: • クエリの並列化 • 事前条件チェックによる不要クエリの削減 • 隣接トラックのグループ化(1桁オーダーで削減) SHACL 検証の最適化 • 問題:大規模データセット(独・仏)で深刻なパフォーマンス低下 • 対策: • SHACLエンジンをpyshaclからmaplibに変更 • 変更内容に応じたシェイプの事前選択 第6回ナレッジグラフ勉強会@オンライン 12

Slide 13

Slide 13 text

まとめと今後の展望 本研究の貢献 • 大規模実運用システムでのセマンティック技術の成功事例 • 3,900万トリプルの知識グラフを維持管理 • 複数EU加盟国のデータ統合を実現 • ガバナンスと技術的課題への実践的解決策を提示 今後の展開 • マイクロレベルのトポロジー記述への対応 • アクセス制限付きレジストリの実装 • 手続き的ルールのSHACL化でデジタル政策立案を推進 感想 (by発表者) • 実際の大規模システムでの活用が行われているのは素直にすごい。 • 変更点の伝搬を手動で追わないといけないのは大変そうで、LLM等を使っ た自動検証に期待したい。 第6回ナレッジグラフ勉強会@オンライン 13