• 概要 • KGは主流技術となったが、⼤規模にKGを操作するためのRDF, SPARQL中⼼のツールセットは様々で あり、統合が難しい。 • データベース: RDF triple store, Neo4J等、操作: graphy, RDFlib等、エンティティリンキング: WAT, BLINK等、 エンティティ解決: MinHash-LSH, MFIBlocks等, 埋め込み: PyTorch-BigGraph等、グラフ分析: graph-tool, NetworkX等 • ⼤規模KGを操作、検証、分析するためのフレームワークKnowledge Graph Toolkit (KGTK)を開発 • 貢献 • KGをハイパーグラフとして表すことができるKGTKファイル形式の開発 • インポートモジュール︓N-Triples, Wikidata修飾⽤語, ConceptNet等異なるフォーマットをKGTK形式に変換 • グラフ操作モジュール︓KGのvalidate, clean, filter, join, sort, mergeをする • クエリと分析モジュール︓中⼼性、連結成分の計算、 RoBERTa, BERT, DistilBERTを使⽤してテキストベー スのグラフ埋め込み • エクスポートモジュール︓KGTKフォーマットをRDF、Neo4J⽤property graph、GMLなどに変換 • Unixパイプに基づいて複数のKG操作を構成するためのフレームワーク • Authors: Filip Ilievski, Daniel Garijo, Hans Chalupsky, Naren Teja, Yixiang Yao, Craig Rogers, Ronpeng Li, Jun Liu, Amandeep Singh, Daniel Schawbe and Pedro Szekely (Univ. of Southern California, USA., Pontificia Universidade Católica Rio de Janeiro, Brazil) Resources Track SESSION 3B: KNOWLEDGE GRAPH Fully reproduced https://github.com/usc-isi-i2/kgtk/