本研究では、ドメインオントロジーの構築支援を目指して、公共の大規模Linked Open Data(LOD)の1つであるWikidataから、対象となるドメイン概念を抽出する方法論を提案する。提案手法では、対象ドメインに関する検索エンティティを与えて、共通する上位エンティティの出現回数、及びそれらパス関係の連鎖をもとにしてグラフ解析を行うことで、ドメイン概念のis-a階層を得る。今回、同手法を応用したWikidataからのクラス階層抽出の事例として、高分子材料に関する新規のドメインオントロジーの構築について概説する。
In this study, in order to support the construction of domain ontologies, we propose a methodology for extracting target domain concepts from a large-scale public Linked Open Data (LOD) system. In the proposed method, we obtain the class-related hierarchy of the domain concept by the occurrences of common upper entities and the chain of those path relationships. As an example of class hierarchy extraction from LOD, we describe the construction of a domain ontology for polymeric materials using Wikidata.