高分子材料オントロジーの構築に向けた Wikidataからのドメイン概念抽出

⾼分⼦材料オントロジーの構築に向けた Wikidataからのドメイン概念抽出 2020年11⽉20⽇第52回セマンティックウェブとオントロジー研究会⼈⼯知能学会研究会 SIG-SWO-052-03 Extraction of Domain Concepts
from Wikidata for Construction of Polymer Material Ontology 久⽶慧嗣1 古崎晃司1 1⼤阪電気通信⼤学

オントロジー⽣命科学、医療、⼯学、農学などの各領域に特化したドメインオントロジーの構築や利活⽤が進み、LODとしての公開も進んでいる。 Linked Open Data (LOD) また、材料情報学分野のNEDOプロジェクトでは、⾼分⼦・⾼分⼦材料、その物性情報を扱う
ドメインオントロジーの構築を進めている。「概念化の明⽰的な記述」と定義される。対象となる知識を体系化して知識処理を⾏う中核技術である。

研究プロジェクトの課題・⽬的課題・ゼロからの⼿作業でのオントロジー構築には⼤きな労⼒がかかる・対象語彙範囲の曖昧さ・再現性や妥当性評価・他のオントロジーとの互換性（従来のオントロジー構築）⼈⼿による知識抽出
⽂献/論⽂オントロジーの初期モデル（研究プロジェクトの⽬的）グラフ構造に基づく知識階層の抽出により、汎⽤LODから対象概念のサブセットを抽出して、ドメインオントロジーの初期モデルを作る。（提案法）汎⽤の公共LOD グラフ構造に基づく知識階層の抽出オントロジーの初期モデル

本研究の⽬標設定ドメインオントロジーの構築では、（１）クラス階層（is-a階層）、及び（２）各クラスの定義（is-a階層以外の関係）を設計する必要がある。本研究では、汎⽤LODからのクラス階層の構築に取り組む。 Wikidataは、ヒト、⾏政区画、構造物、化合物、映画、天体、論⽂など、様々なドメイン知識の集合体と位置付けられる。汎⽤LOD
/ Wikidata （１）対象ドメインのクラス階層ドメインオントロジーの初期モデル不⾜する概念・クラス定義などを追加したオントロジーのモデル（２）対象ドメインのクラス定義

検索の起点となる上位概念下位クラス探索（探索範囲）クラス階層抽出のコンセプト、具体的な課題概念階層のグラフ構造 ①対象ドメインにおける下位クラス探索の起点となるエンティティ/概念を同定する。 ②起点となるエンティティ/概念とそこ
からの展開する検索範囲（展開段数）を決定する。具体的な課題

展開段数１展開段数２（⼊⼒）・検索エンティティ（）（出⼒）・展開共通上位エンティティ
（）・下位概念の検索範囲（）（１）対象ドメインの語彙を「検索エンティティ(⼊⼒)」として与え、上位概念グラフを得る。（２）起点となる共通の上位概念（展開共通上位エンティティ）を同定する。（３）グラフの部分構造を利⽤して、起点となる共通エンティティから⼊⼒地点まで最⼤段数を展開段数として決める。（４）各起点から下位概念を検索して、概念のクラス階層を抽出する。対象ドメインに関するクラス階層の抽出⽅法の概要

提案⼿法による⾼分⼦オントロジー構築の実施例⾼分⼦データベースPoLyInfoからの語彙収集⾼分⼦に関わるドメイン語彙 515語彙 Wikidataとのリンキング対象ドメインに関する 188 エンティティワークフロー

Wikidataのクラス階層に関するデータモデル QID: wikidataのエンティティID subClassOf: wdt:P279, instanceOf: wdt:P31 Wikidataのデータモデル・SPARQL検索モデル QID QID
subClassOf関係 QID subClassOf関係 instanceOf関係下位概念上位概念上位概念 QID 下位概念 QID instanceOf関係上位概念のSPARQL検索モデル検索エンティティ subClassOf | instanceOf subClassOf subClassOf

得られたクラス階層の上位関係対象ドメインに関する 188 検索エンティティ (⼊⼒) XE2Τεςϧ XE2༗ػԽ߹෺ XE2Խ߹෺ͷߏ଄Ϋϥε XE2Ξϧσώυ XE2ΧϧϘχϧԽ߹෺
XE2ྲྀମ XE2࣮ମ XE2࿈ଓഔମ XE2$"4ొ࿥൪߸ XE2OVNCFSJOHTDIFNF XE2ొ࿥൪߸ XE2Խֶ෺࣭ XE2૬ฏߧ XE2ฏߧ XE2Τʔςϧ XE2༗ػࢎૉԽ߹෺ XE2ΞϞϧϑΝε XE2݁থߏ଄ XE2݁থܥ XE2ΧϧϘϯࢎ༠ಋମ XE2༠ిਖ਼઀ XE2ແ࣍ݩྔ XE2ϦεΫ XE2ϙςϯγϟϧ XE2ෆ͔֬͞ XE2ઐ໳෼໺ XE2஌ࣝ XE2ଌఆ۩ XE2૷ஔ XE2Պֶػث XE2૬ XE2೤ྗֶঢ়ଶ XE2༥ղ XE2૬సҠ XE2ਫૉԽ෺ XE2ਫૉԽ߹෺ XE2ϥϝఆ਺ XE2஄ੑ཰ XE2ࡐྉಛੑ XE2෺ੑ XE2ࡐྉ XE2෦෼ XE2ૉࡐ XE2෺ཧྔ XE2ྔ XE2ݸମྔ XE2ӄΠΦϯ XE2ΠΦϯ XE2ΠΦϯͷߏ଄Ϋϥε XE2໋୊ XE2৘ใ XE2਺ֶతର৅ XE2EFDMBSBUJWFTFOUFODF XE2ిؾ఍߅཰ XE2ࣔڧม਺ XE2ϓϩηε XE2աఔ XE2ࠩҟ XE2ू߹ XE2ؔ܎ੑ XE2Մ೩ੑΨε XE2Մ೩෺ XE2ؾମ XE2ൺॏ XE2૬ରີ౓ XE2޻ֶ XE2Ԡ༻Պֶ XE2ܦࡁ෦໳ XE2ந৅తର৅ XE2NBOVGBDUVSJOHFOHJOFFSJOH XE2ϓϩηεγεςϜ޻ֶ XE2ޠኮૉ XE2ݴޠ૷ஔ XE2FNJDVOJU XE2෺ମ XE2ࢎ XE2Խ߹෺ XE2Խֶ੒෼ XE2७෺࣭ XE2WBSJBCMFBOEBUUSJCVUF XE2ಛੑ XE2ݩૉ XE2NBUFSJBMTVCTUBODF XE2ؔ਺ XE2ೋ߲ؔ܎ XE2෦෼ࣸ૾ XE2ଟՁؔ਺ XE2ࢷ࣭ XE2ੜ෺ߴ෼ࢠ XE2෼ࢠ XE2෼ࢠ࣮ମ XE2਺ֶతදه XE2දه๏ XE2Խֶࣜྔ XE2Խֶࣜ XE2ྗ XE2JOGMVFODF XE2WFDUPSRVBOUJUZ XE2*42೿ੜ਺ྔ XE2ۚଐ XE2Մ஁ੑࡐྉ XE2෺࣭ͷঢ়ଶ XE2GVOEBNFOUBMTUBUFPGNBUUFS XE2ӷମ XE2ݻମ XE2෺࣭ XE2Թ౓ XE2εΧϥʔ XE2ঢ়ଶྔ XE2࣌ؒ XE2ܥྻ XE2ଌఆՄೳू߹ XE2ϓϥενοΫ XE2ίϧϞΰϩϑۭؒ XE2Ґ૬ۭؒ XE2EJTQPTJUJPO XE2ΤϯςΟςΟ XE2QSPQFOTJUZ XE2มԽ XE2ࣄ৅ XE2نଇ XE2ਓ଄࣮ମ XE2จ XE2คཻମ XE2ྲྀಈੑ ߹੒थࢷ XE2਺ XE2஋ XE2ॏ߹։࢝ࡎ XE2ిྲྀ XE2GMPX XE2ϙϦΧϧϘϯࢎ XE2ΧϧϘϯࢎ XE2ΦϨϑΟϯ XE2ࢷ๱଒Խ߹෺ XE2ΦϨϑΟϯԽ߹෺ XE2ෆ๞࿨୸Խਫૉ XE2ઃඋ XE2ಓ۩ XE2ֶ໰ྖҬ XE2Ұ࣌తͳ࣮ମ XE2࢖͍ࣺͯ XE2ফ໣඼ XE2঎඼ XE2ΞΠκοτিܸࢼݧ XE2ٕज़ XE2ΞϏϦςΟ XE2ಛ௃ྔ XE2ҩༀ඼ XE2ҩༀ඼ XE2ༀ෺ XE2৮ഔ XE2༻ޠ XE2ίϯόʔλ XE2έΠૉԽ߹෺ XE2ઈԑഁյిѹ XE2ిѹ XE2ݴޠ୯Ґ XE2೪౓ XE2άϦηϦυͷؚ༗ྔ XE2ࡐྉͷػցతੑ࣭ XE2ਫͷੑ࣭ XE2ຎࡲ XE2εΧϥʔ ਺ֶ XE2൓ରশςϯιϧ XE2ରশςϯιϧ XE2෺ཧݱ৅ XE2ݱ৅ XE2ϑΣϊʔϧ XE2Մ೩ੑݻମ XE2ϑΣϊʔϧྨ XE2ؔ܎ XE2ߏ੒ཁૉ XE2ೝࣝ෺ମ XE2઀ணࡎ XE2QSPDFTTNBUFSJBM XE2Խֶༀ඼ͷઐ໳త࢖༻ XE2ςϯιϧ XE2ΞηνϨϯ XE2ΞϧΩϯ XE2൱ೝ XE2SFGVTBM XE2ϕΫτϧ XE21ϕΫτϧ XE2༗ػࢎ XE2ΦΩιࢎ XE2͹ΒੵΈ՟෺ XE2USBOTQPSUBCMFHPPET XE2ୈೋՄࢉతۭؒ XE2Մ෼ۭؒ XE2ୈҰՄࢉతۭؒ XE2ϦϯσϨϑۭؒ XE2SJTLTPVSDF XE2֬཰ XE2OBUVSBMQSPDFTT XE2ԡग़੒ܗ XE2NBOVGBDUVSJOHQSPDFTT XE2GPSNJOH XE2ࢦ਺ XE2߹੒थࢷ XE2ఱવथࢷ XE2ࠞ߹෺ XE2GJMNGPSNFS XE2OVUSJNFOU XE2ΤωϧΪʔஷଂ XE2ޫֶݱ৅ XE2ϙϦΞϛυ XE2ણҡ XE2Խֶ෺࣭ͷάϧʔϓ·ͨ͸Ϋϥε XE2ॏ߹ମ XE2ܥ XE2γεςϜ XE2Ϟϧ࣭ྔ XE2Ϟϧྔ XE2Խֶྔ XE2೤ॲཧ XE2ϙϦΠϛυ XE2Πϛυ XE2PSHBOJDQPMZNFS XE2ϙϦϑΣχϨϯεϧϑΝΠυ XE2ϙϦενϨϯ XE2Ϗχϧߴ෼ࢠ XE2ϙϦεϧϗϯ XE2܈ XE2ߴ෼ࢠ XE2ϙϦ΢Ϩλϯ XE2ϙϦϏχϧΞϧίʔϧ XE2౶Ξϧίʔϧ XE2༹ഔ XE2SPMF XE2ֶशهԱ XE2ೝࣝ XE2ֶशߦಈ XE2ܹࢗ΁ͷ൓Ԡ XE2ੜ෺ֶతϓϩηε XE2֎తܹࢗ΁ͷ൓Ԡ XE2ਆܦܥͷϓϩηε XE2ث׭ܥͷϓϩηε XE2఻ಋ XE2Ϗδωεϧʔϧ XE2֓೦ XE2৺৅දݱ XE2ඒज़඼ͷࡐྉ XE2༥఺ XE2࢈෺ XE2٬ମ XE2Ξϧίʔϧ XE2ਫࢎԽ෺ XE2ந৅తଘࡏ XE2ओମ XE2DMBTTJDBMTUBUFPGNBUUFS XE2OPODMBTTJDBMTUBUFPGNBUUFS XE2QSFSFHVMBSTQBDF XE2ҙຯ୯Ґ XE2ҙຯ XE2࠯ࣜԽ߹෺ XE2ΞηνϨϯ XE2޻ఔ XE2UFDIOJDBMQSPDFTT XE2΢ΟΩσʔλͷϝλΫϥε XE2ཻࢠ XE2ϚʔΫϗʔ΢ΠϯΫࣜ XE2ެࣜ XE2ू߹വ਺ XE2൓ࣹ XE2TVSGBDFQIFOPNFOPO XE2Ξϛϯ XE2༗ػ஠ૉԽ߹෺ XE2ਓ޻෺ XE2ࡒ XE2தؒੜ࢈෺ XE2NFBOJOH XE2DPMMFDUJPOFOUJUZ XE2Ϋϥε XE2Ϋϥε XE2ΫϩϚτάϥϑΟʔ XE2਍அߦҝ XE2࣮ݧٕज़ XE2෼ੳٕज़ XE2෼཭޻ֶ XE2ྟք XE2ج XE2෦෼ XE2࿈ଓഔମ XE2༹ղ౓ XE2έτϯ XE2ද໘ுྗ XE2NPEFPGUPYJDBDUJPO XE2Խֶ࡞༻ͱ༻్ XE2NPEFPGBDUJPO XE2ػೳ ޻ֶ XE2ҙਤΛ൐͏ਓͷߦҝ XE2ൺ XE2෺ཧతϓϩηε XE2σδλϧ XE2σʔλ XE2HSPVQPSDMBTTPGQIZTJDBMPCKFDUT XE2۶ં཰ XE2୸ૉԽ߹෺ XE2ޫֶػث XE2ޫֶγεςϜ XE2֬཰աఔ XE2೤෼ղ XE2Խֶ൓Ԡ XE2ެཧ XE2ݴ໌ XE2෦෼ू߹ XE2αϒΫϥε XE2ҩྍॲஔ XE2ߏ੒ૉ XE2ϞϊϚʔ XE2ج४ XE2Ձ஋؍ XE2࣌ؒͷ୯Ґ XE2෺ཧ୯Ґ XE2൓ࣹ XE2Ҡಈ XE2ߦಈ XE2ۭؒ XE2ํ๏ XE2ଌఆ๏ XE2ॏ߹൓Ԡ XE2DBVTFPGDBODFS XE2IFBMUISJTL XE2ԠྗͻͣΈঢ়ଶ XE2ঢ়ଶ XE2ϥδΧϧ XE2൓Ԡੑதؒମ XE2൓Ԡதؒମ XE2೤ྗֶաఔ XE2ঢ়ଶมԽ XE2มଶ XE2DPOUSJCVUJOHGBDUPS XE2GBDUPS XE2ִ࣌ؒؒ XE2ΞχϦϯ XE2ൃ؞ੑ XE2๕߳଒Խ߹෺ XE2Ϋϥε***"Մ೩ੑӷମ XE2৬ۀੑൃ͕Μੑ෺࣭ XE2OPYBF XE2۟ XE2ϙϦΤεςϧ XE2HFPNFUSJDDPODFQU XE2ݩ XE2Ξϛυ XE2஠ૉԽ߹෺ XE2ࢎૉԽ߹෺ XE2৯඼ఴՃ෺ XE2৯ࡐ XE2BEEJUJWF XE2׆ੑԽΤωϧΪʔ XE2ཁٻ࢓༷ XE2ߦҝ XE2ߦҝ XE2DPODFQUJOQIZTJDT XE2ଌ౓࿦ XE2ن४ XE2༗ݶՃ๏తଌ౓ XE2BEEJUJWFGVODUJPO XE2NFBTVSFERVBOUJUZ XE2NFBTVSFNFOUUFDIOJRVF XE2δΤϯ XE2ߗ౓ XE2ෳૉ؀ࣜԽ߹෺ XE2؀ࣜԽ߹෺ XE2มܗ XE2ϝοηʔδ XE2ϝλΫϥε XE2DMBTTPSNFUBDMBTTPG8JLJEBUBPOUPMPHZ XE2ݪཧ XE2ࣹ XE2ࣸ૾ XE2൒ۚଐ XE2ඇۚଐݩૉ XE2ݦඍڸ XE2ޠኮ߲໨ XE2Ϟσϧ XE2Ծઆ XE2දݱ XE2ෆࡏ XE2֓೦ମܥ XE2දݱγεςϜ XE2ݺͼ਺ XE2ϢχʔΫࣝผࢠ XE2Ұҙࣝผࢠ XE2໋໊๏ XE2ද໘ྗ XE2ଟ༷ମ XE2ϋ΢ευϧϑۭؒ XE2OPO)BVTEPSGGNBOJGPME XE2ӷথ XE2ܭଌػث XE2Ԡྗ XE2׭ೳੑ XE2Խֶతੑ࣭ XE2ܗଶ XE2৺తର৅ XE2৯඼ XE2$MBTT*$GMBNNBCMFMJRVJE XE2ҾՐੑӷମ XE2$MBTT**DPNCVTUJCMFMJRVJE XE2૯শ XE2DPNCVTUJCMFQPXEFS XE2ค XE2ߏ଄ XE2UZQF XE2༠ి཰ XE2NFBOT XE2QPTTJCJMJUZ XE2ϝϥϛϯ XE2QSPEVDU XE2ৗ༻ݪࢠ XE2४ಉܕ XE2਺ֶత֓೦ XE2ٵ࣪ੑ XE2Ϋϥε XE2BEEJUJWFPCKFDU XE2৺ཧաఔ XE2ེԽ෺ XE2ེԫԽ߹෺ XE2࣍ݩ XE2ଟࡉ๔ݸମͷϓϩηε XE2۩ମతର৅ XE2஄ྗੑ XE2؀ڥ XE2֎ք XE2ෆ๞࿨ࢷ๱ࢎ XE2ࢷ๱ࢎ XE2ෆ๞࿨݁߹ XE2ESZCVMLDBSHP XE2UZQFPGNBOVGBDUVSFEHPPE XE2Խֶաఔ XE2Ճ๏తࣸ૾ XE2๕߳଒୸Խਫૉ XE2෺ཧతঢ়ଶ XE2ঢ়ଶ XE2ঢ়ଶม਺ ੍ޚཧ࿦ XE2ࣔྔੑͱࣔڧੑ XE2JTPMBUJPO XE2ॖ߹ॏ߹ XE2ஞ࣍ॏ߹ XE2ෳ߹ཻࢠ XE2Խֶత࣮ମ XE2Խֶछ XE2γϦϯμʔ XE2ػցཁૉ XE2݁থԽ౓ XE2݁থԽ XE2ແػߴ෼ࢠ XE2γϥϯྨ XE2๞࿨ਫૉԽέΠૉ XE2γϦίϯਫૉԽ෺ XE2δΞϛϯ XE2ϥΫλϜ XE2࣌ؒ XE24*ซ༻୯Ґ XE26$6.EFSJWFEVOJU XE2QPUFOUJBMEJGGFSFODF XE2IZESPDBSCZMFOFHSPVQ XE2PSHBOPEJZMHSPVQ XE2ϥδΧϧॏ߹ XE2ৠؾѹ XE2ѹྗ XE2ۭؒϕΫτϧ XE2ۭ࣮࣌ؒମ XE2ୈ଒ݩૉਫૉԽ෺ XE2ѹॖ XE2ۓுͱѹॖ XE2Ґ૬ଟ༷ମ XE2ݻ༗೪౓ XE2زԿҟੑମ XE2ҟੑԽ XE2ࣗݾू߹ XE25ۭؒ XE2όϦΦϯ෺࣭ XE2NBOJGFTUBUJPO XE2ྔࢠཻࢠ XE2෺ཧత࣮ଶ XE2Պֶ XE2৫෺ XE2࣭ྔྔࢠཻࢠ XE2ϒϥσΟΦϯ XE2NFEJDJOBMQSPEVDU XE2ενϨϯ XE2ίϞϯϚλʔ XE2JOTVMBUJPO XE2МίϯύΫτۭؒ XE2஋ XE2઀৮ྗ XE2ີ౓ XE2ࠩ XE2PQFSBUJPOSFTVMU XE2ॲཧ݁Ռ XE2DPOTFRVFODF XE2ੜ෺ֶతݱ৅ XE2CJOEJOHBHFOU XE2ଌఆՄೳۭؒ XE2ϙϦΤʔςϧ XE2௜߱܎਺ XE2܎਺ XE2༹ղ XE2ઈԑ ిؾ XE2ดू߹ XE2'Мू߹ XE2QSFNJTF XE2ߗ͞ XE2ΞΫϦϧࢎ XE2༹ӷॏ߹ XE2ཅΠΦϯ XE24*PSBDDFQUFEOPO4*VOJU XE2ιʔόʔۭؒ XE2ըࡐ XE2ࣔྔม਺ XE2ϙϦέτϯ XE2ϝσΟΞ XE2࣍ݩ XE2ΧϧϘϯࢎԘ XE2ݱ৅ XE2ΧϧϘϯࢎΤεςϧ XE2ϗεϑΝθϯ XE2GPSNBMJ[BUJPO XE2ଟॏू߹ XE2ՙిཻࢠ XE2෩श XE2ؚ஠ૉԽ߹෺ XE2ه߸ XE2੔ཧ XE2ཱମنଇੑ XE2ཱମ XE2ਓͷߦಈ XE2݁߹ࡎ XE2఺ͷവख XE2ίϯύΫτۭؒ XE2ہॴίϯύΫτۭؒ XE2ՄࢉίϯύΫτۭؒ XE2ύϥίϯύΫτۭؒ XE2࡞඼ XE2ମੵ XE2ମੵ ෇Ճؔ਺ XE2໘ྔ XE2ਪҠؔ܎ XE2ൺ༠ి཰ XE2Πϛϯ XE2ΠιγΞωʔτ XE2ਪ࿦ XE2εϧϗΩγυ XE2༗ػེԫԽ߹෺ XE2֎Ҽੑ XE2ϙϦΞΫϦϧࢎ XE2ϗϞϙϦϚʔ XE2ϙϦϗεϑΝθϯ XE2γϥϯ XE2εϧϗϯ XE2TVMGPOZMDPNQPVOE XE2ϓϩτίʔϧ XE2ࠂൃ XE2νΦΞϛυ XE2νΦέτϯ XE2Ξηλʔϧ XE2ϙϦ΢ϨΞ XE2άϦίʔϧ XE2δΧϧϘϯࢎ XE2ࢷ๱Ξγϧ XE2ઈԑഁյ XE2νΦΤεςϧ XE2΢Ϩλϯ XE2ϙϦΦϨϑΟϯ XE2୸Խਫૉ XE2δέτϯ XE2γϩΩαϯ XE2ϑΣχϨϯ XE2ΞϦϨϯ XE2ۭ࣮ؒମ XE2݁থ XE2ଋറঢ়ଶ XE2ೋݩԽ߹෺ XE2ଐੑͷྨܕ XE2ਓؒͷߦҝ XE2༗ػओ଒Խ߹෺ XE2೤๲ு܎਺ XE2ిؾ఻ಋ཰ XE2߶ੑ཰ XE2Պֶతํ๏ XE2ՙॏͨΘΈԹ౓ XE2೤తಛੑ XE2సҠԹ౓ XE2೘ૉ XE2ۂ໘ XE2㔸ੑ XE2ൺ೤༰ྔ XE2ൺྔ XE2ಶ఺ XE2هԱ XE2ϙϦΤεςϧ XE2߹੒ણҡ XE2ϩοΫ΢Σϧߗ͞ XE2ༀཧ࡞༻ XE2GBDUPS XE2ม਺ XE2ඃԋࢉࢠ XE2ࢎૉ෼ࢠ࣮ମ XE2࣍ݩଟ༷ମ XE2Ձ XE2νΦ೘ૉ XE2ۚଐՃ޻ XE2FOEPSFMBUJPO XE2TFSJBMSFMBUJPO XE2༗ػ஠ૉԽ߹෺ XE2ӡಈ XE2෍ XE2ϥΫτϯ XE2ΦΩααΠΫϧ XE2ඇอଘྗ XE2ϙϦγϩΩαϯ XE2ΠϯϔϨϯτ೪౓ XE2֦ࢄ܎਺ XE2ࣗݾ૊৫Խ XE2෇Ճॏ߹ XE2մঢ়ॏ߹ XE2ϙϦΧʔϘωʔτ XE2஌ࣝ૊৫Խମܥ XE2ϦϯԽ߹෺ XE2QIZTJDBMJOUFSGBDF XE2RVBTJUSBOTJUJWFSFMBUJPO XE2਺ࣜ XE2೤๲ு XE2ॏ߹౓ XE2OPOCJPMPHJDBMDPNQPOFOU XE2έΠૉ XE2OBNJOHDPOWFOUJPO XE2༗ػෳૉ؀Խ߹෺ XE2෼ࢠ࣮ମͷάϧʔϓ·ͨ͸Ϋϥε XE2ϙϦϗεϑΝθϯ XE2εϧϑΟυ XE2೤఻ಋ XE2ಁա܎਺ XE2୯݁থ XE2ޙॲཧ XE2Ξϛϊࢎ XE2ϙϦεϧϑΟυ XE2UFDIOPMPHJDBMDPNQPOFOU XE2ਤܗ XE2ޠ XE2ΨϥεసҠ఺ XE2໊લ XE2࣮ݧث۩ XE2UFSNJOPMPHZ XE2ήϧਁಁΫϩϚτάϥϑΟʔ XE2ΦϖϨʔγϣφϧϦεΫ XE2༠ಋମ XE2఺܈ XE2Ծൺॏ XE2ѹॖ཰ XE2։؀ॏ߹ XE2ݒ୙ॏ߹ XE2ք໘ XE2଱೤ੑ XE2۶ંܭ XE2਺ฏۉ෼ࢠྔ XE2ೕԽॏ߹ XE2ޫֶݦඍڸ XE2׳༻໊ XE2෸఺্ঢ XE2ϙϦΠϛϯ XE2ϙϦδΤϯ XE2ϙϦϋϩΦϨϑΟϯ XE2ϙϦϚʔ࠯ XE2ϥϯμϜߏ଄ XE2݁থԽ࣌ؒ XE2ΞΠκουিܸ஋ XE2ྟք֯ํࣜͷ۶ંܭ XE2ΧνΦϯॏ߹ XE2ΞχΦϯॏ߹ XE2ΞχϦϯ༠ಋମ XE2ΞϛϊΧϧϘϯࢎ XE2ΦΩγΧϧϘϯࢎ XE2Ψε֦ࢄ܎਺ XE2Ψεಁա܎਺ XE2Ψε༹ղ౓ XE2ΫϦʔϓಛੑ XE2%/"ͷΞχʔϦϯά 上位概念グラフ 709エンティティ/1169トリプル起点となる共通エンティティ中間エンティティ検索エンティティ上位概念グラフの部分構造

対象ドメインに関する 188 検索エンティティ (⼊⼒) 上位概念グラフ 709エンティティ/1169トリプル XE2Ξϧσώυ XE2Խ߹෺ͷߏ଄Ϋϥε- XE2ΧϧϘχϧԽ߹෺- XE2$"4ొ࿥൪߸
XE2OVNCFSJOHTDIFNF XE2ొ࿥൪߸ XE2Խֶ෺࣭- XE2૬ฏߧ XE2ฏߧ XE2ΞϞϧϑΝε XE2݁থߏ଄ XE2݁থܥ XE2༠ిਖ਼઀ XE2ແ࣍ݩྔ- XE2ઐ໳෼໺ XE2஌ࣝ- XE2༥ղ XE2૬సҠ- XE2ϥϝఆ਺ XE2஄ੑ཰- XE2ࡐྉಛੑ- XE2෺ੑ- XE2ࡐྉ XE2෦෼- XE2ૉࡐ- XE2ӄΠΦϯ XE2ΠΦϯ- XE2ΠΦϯͷߏ଄Ϋϥε- XE2ిؾ఍߅཰ XE2෺ཧྔ- XE2ࣔڧม਺- XE2ࠩҟ XE2ू߹- XE2ؔ܎ੑ- XE2ൺॏ XE2૬ରີ౓ XE2޻ֶ XE2Ԡ༻Պֶ XE2ܦࡁ෦໳ XE2NBOVGBDUVSJOHFOHJOFFSJOH XE2ϓϩηεγεςϜ޻ֶ XE2ݩૉ XE2NBUFSJBMTVCTUBODF- XE2ࢷ࣭ XE2༗ػԽ߹෺- XE2ੜ෺ߴ෼ࢠ XE2਺ֶతදه XE2දه๏- XE2Խֶࣜྔ XE2ྔ- XE2Խֶࣜ XE2ۚଐ XE2Մ஁ੑࡐྉ- XE2ؾମ XE2GVOEBNFOUBMTUBUFPGNBUUFS XE2Թ౓ XE2εΧϥʔ- XE2ঢ়ଶྔ- XE2࣌ؒ XE2ܥྻ- XE2ଌఆՄೳू߹ XE2ϓϥενοΫ XE2EJTQPTJUJPO XE2ΤϯςΟςΟ XE2คཻମ XE2࿈ଓഔମ- XE2ྲྀಈੑ ߹੒थࢷ XE2ॏ߹։࢝ࡎ XE2Խ߹෺- XE2ిྲྀ XE2GMPX XE2ϙϦΧϧϘϯࢎ XE2ΧϧϘϯࢎ- XE2ֶ໰ྖҬ XE2࢖͍ࣺͯ XE2ফ໣඼ XE2঎඼- XE2ΞΠκοτিܸࢼݧ XE2ٕज़- XE2ҩༀ඼ XE2ҩༀ඼ XE2ༀ෺ XE2৮ഔ XE2༻ޠ XE2ίϯόʔλ- XE2έΠૉԽ߹෺ XE2ઈԑഁյిѹ XE2ిѹ XE2ϑΣϊʔϧ XE2Մ೩ੑݻମ- XE2ϑΣϊʔϧྨ XE2ΞηνϨϯ XE2Մ೩ੑΨε- XE2ΞϧΩϯ XE2͹ΒੵΈ՟෺ XE2USBOTQPSUBCMFHPPET XE2ԡग़੒ܗ XE2NBOVGBDUVSJOHQSPDFTT XE2GPSNJOH XE2ϓϩηε- XE2OVUSJNFOU XE2ΤωϧΪʔஷଂ XE2ޫֶݱ৅ XE2෺ཧݱ৅- XE2ϙϦΞϛυ XE2ણҡ XE2Խֶ෺࣭ͷάϧʔϓ·ͨ͸Ϋϥε- XE2ॏ߹ମ- XE2Ϟϧ࣭ྔ XE2Ϟϧྔ- XE2Խֶྔ- XE2೤ॲཧ XE2ϙϦΠϛυ XE2Πϛυ XE2PSHBOJDQPMZNFS- XE2ϙϦϑΣχϨϯεϧϑΝΠυ XE2߹੒थࢷ- XE2ϙϦενϨϯ XE2Ϗχϧߴ෼ࢠ- XE2ϙϦεϧϗϯ XE2܈- XE2ߴ෼ࢠ- XE2ϙϦ΢Ϩλϯ XE2ϙϦϏχϧΞϧίʔϧ XE2౶Ξϧίʔϧ- XE2༹ഔ XE2ӷମ- XE2SPMF XE2Խֶༀ඼ͷઐ໳త࢖༻- XE2ܹࢗ΁ͷ൓Ԡ XE2ੜ෺ֶతϓϩηε- XE2֎తܹࢗ΁ͷ൓Ԡ XE2఻ಋ XE2Ϗδωεϧʔϧ XE2نଇ- XE2༥఺ XE2DMBTTJDBMTUBUFPGNBUUFS XE2OPODMBTTJDBMTUBUFPGNBUUFS XE2෺࣭ͷঢ়ଶ- XE2࠯ࣜԽ߹෺ XE2ΞηνϨϯ XE2΢ΟΩσʔλͷϝλΫϥε XE2ϚʔΫϗʔ΢ΠϯΫࣜ XE2ެࣜ XE2ू߹വ਺ XE2ؔ਺- XE2൓ࣹ XE2TVSGBDFQIFOPNFOPO XE2ਓ଄࣮ମ- XE2ݱ৅ XE2ࡒ- XE2ΫϩϚτάϥϑΟʔ XE2਍அߦҝ- XE2࣮ݧٕज़- XE2෼ੳٕज़- XE2෼཭޻ֶ- XE2ྟք XE2ج XE2෦෼ XE2෼ࢠ࣮ମ- XE2࿈ଓഔମ XE2༹ղ౓ XE2ද໘ுྗ XE2σδλϧ XE2σʔλ XE2۶ં཰ XE2άϦηϦυͷؚ༗ྔ- XE2ࢦ਺- XE2೤෼ղ XE2Խֶ൓Ԡ- XE2ϞϊϚʔ XE2෼ࢠ- XE2࣌ؒͷ୯Ґ XE2෺ཧ୯Ґ- XE2൓ࣹ XE2Ҡಈ XE2มԽ- XE2ߦಈ- XE2ԠྗͻͣΈঢ়ଶ XE2ঢ়ଶ XE2ϥδΧϧ XE2൓Ԡੑதؒମ XE2൓Ԡதؒମ XE2ִ࣌ؒؒ XE2Ұ࣌తͳ࣮ମ- XE2ಛੑ- XE2ΞχϦϯ XE2ൃ؞ੑ- XE2๕߳଒Խ߹෺- XE2Ϋϥε***"Մ೩ੑӷମ XE2৬ۀੑൃ͕Μੑ෺࣭ XE2۟ XE2ݴޠ૷ஔ- XE2ߏ੒ૉ- XE2ݴޠ୯Ґ- XE2ϙϦΤεςϧ XE2Τεςϧ- XE2৯඼ఴՃ෺ XE2৯ࡐ XE2BEEJUJWF XE2׆ੑԽΤωϧΪʔ XE2ཁٻ࢓༷ XE2DPODFQUJOQIZTJDT XE2ଌ౓࿦ XE2ن४- XE2༗ݶՃ๏తଌ౓ XE2BEEJUJWFGVODUJPO XE2NFBTVSFERVBOUJUZ XE2NFBTVSFNFOUUFDIOJRVF XE2δΤϯ XE2ΦϨϑΟϯ- XE2ߗ౓ XE2มܗ XE2ϝλΫϥε- XE2DMBTTPSNFUBDMBTTPG8JLJEBUBPOUPMPHZ XE2൒ۚଐ XE2ඇۚଐݩૉ XE2ݦඍڸ XE2ޫֶػث- XE2֓೦- XE2ޠኮ߲໨- XE2Ϟσϧ XE2Ծઆ XE2දݱ- XE2ෆࡏ XE2Ϋϥε- XE2ݺͼ਺ XE2ϢχʔΫࣝผࢠ XE2Ұҙࣝผࢠ XE2໋໊๏ XE2ӷথ XE2Ԡྗ XE2׭ೳੑ XE2Խֶతੑ࣭- XE2ܗଶ XE2਺ֶతର৅- XE2৯඼ XE2$MBTT*$GMBNNBCMFMJRVJE XE2ҾՐੑӷମ- XE2$MBTT**DPNCVTUJCMFMJRVJE XE2૯শ XE2DPNCVTUJCMFQPXEFS XE2ค XE2༠ి཰ XE2ϝϥϛϯ XE2ෳૉ؀ࣜԽ߹෺- XE2QSPEVDU XE2४ಉܕ XE2ࣹ- XE2ٵ࣪ੑ XE2BEEJUJWFPCKFDU XE2ந৅తର৅- XE2ེԽ෺ XE2ེԫԽ߹෺- XE2࣍ݩ XE2ۭؒ- XE2஄ྗੑ XE2ൺ- XE2؀ڥ XE2֎ք XE2ෆ๞࿨ࢷ๱ࢎ XE2ࢷ๱ࢎ XE2ෆ๞࿨݁߹- XE2ESZCVMLDBSHP XE2UZQFPGNBOVGBDUVSFEHPPE XE2UZQF- XE2Ճ๏తࣸ૾ XE2๕߳଒୸Խਫૉ XE2ෆ๞࿨୸Խਫૉ- XE2JTPMBUJPO XE2ߦҝ- XE2ॖ߹ॏ߹ XE2ஞ࣍ॏ߹- XE2ೝࣝ෺ମ- XE2γϦϯμʔ XE2ػցཁૉ XE2݁থԽ౓ XE2݁থԽ- XE2ແػߴ෼ࢠ XE2γϥϯྨ XE2๞࿨ਫૉԽέΠૉ XE2γϦίϯਫૉԽ෺ XE2δΞϛϯ XE2Ξϛϯ- XE2ϥΫλϜ XE2Ξϛυ- XE2࣌ؒ XE24*ซ༻୯Ґ XE26$6.EFSJWFEVOJU XE2QPUFOUJBMEJGGFSFODF XE2IZESPDBSCZMFOFHSPVQ XE2PSHBOPEJZMHSPVQ XE2ৠؾѹ XE2ѹྗ XE2ୈ଒ݩૉਫૉԽ෺ XE2ਫૉԽ෺- XE2ѹॖ XE2ۓுͱѹॖ XE2Ґ૬ଟ༷ମ XE2ୈೋՄࢉతۭؒ- XE2ଟ༷ମ- XE2ϋ΢ευϧϑۭؒ- XE2ݻ༗೪౓ XE2೪౓- XE2زԿҟੑମ XE2ҟੑԽ XE2NBOJGFTUBUJPO XE2ਓ޻෺- XE2Պֶ XE2৫෺ XE2࢈෺- XE2NFEJDJOBMQSPEVDU XE2ενϨϯ XE2JOTVMBUJPO XE2෺ཧతঢ়ଶ- XE2МίϯύΫτۭؒ XE2Ґ૬ۭؒ- XE2γεςϜ- XE2ີ౓ XE2ࡐྉͷػցతੑ࣭- XE2ࠩ XE2PQFSBUJPOSFTVMU XE2ॲཧ݁Ռ XE2DPOTFRVFODF XE2෦෼ू߹- XE2ଌఆՄೳۭؒ XE2ϙϦΤʔςϧ XE2Τʔςϧ- XE2௜߱܎਺ XE2܎਺- XE2༹ղ XE2Խֶաఔ- XE2աఔ- XE2ઈԑ ిؾ XE2ดू߹ XE2'Мू߹ XE2QSFNJTF XE2໋୊- XE2ߗ͞ XE2ΞΫϦϧࢎ XE2༹ӷॏ߹ XE2ॏ߹൓Ԡ- XE2ཅΠΦϯ XE24*PSBDDFQUFEOPO4*VOJU XE2ࣔྔม਺ XE2ݸମྔ- XE2ϙϦέτϯ XE2έτϯ- XE2ϝσΟΞ XE2࣍ݩ XE2ΧϧϘϯࢎΤεςϧ XE2ΧϧϘϯࢎԘ- XE2ϗεϑΝθϯ XE2෩श XE2ه߸ XE2৘ใ- XE2ཱମنଇੑ XE2ཱମ XE2ίϯύΫτۭؒ XE2ہॴίϯύΫτۭؒ XE2ՄࢉίϯύΫτۭؒ XE2ύϥίϯύΫτۭؒ XE2࡞඼ XE2ମੵ XE2*42೿ੜ਺ྔ- XE2ମੵ ෇Ճؔ਺ XE2໘ྔ- XE2ൺ༠ి཰ XE2Πϛϯ XE2ΠιγΞωʔτ XE2ਪ࿦ XE2εϧϗΩγυ XE2༗ػེԫԽ߹෺- XE2ࢎૉԽ߹෺- XE2֎Ҽੑ XE2ϙϦΞΫϦϧࢎ XE2ϗϞϙϦϚʔ XE2ϙϦϗεϑΝθϯ XE2γϥϯ XE2εϧϗϯ XE2TVMGPOZMDPNQPVOE XE2νΦΞϛυ XE2༗ػ஠ૉԽ߹෺- XE2νΦέτϯ XE2Ξηλʔϧ XE2ϙϦ΢ϨΞ XE2άϦίʔϧ XE2δΧϧϘϯࢎ XE2ࢷ๱Ξγϧ XE2ઈԑഁյ XE2νΦΤεςϧ XE2΢Ϩλϯ XE2ϙϦΦϨϑΟϯ XE2୸Խਫૉ- XE2δέτϯ XE2γϩΩαϯ XE2ϑΣχϨϯ XE2ΞϦϨϯ XE2݁থ XE2ݻମ- XE2ଋറঢ়ଶ- XE2ଐੑͷྨܕ XE2೤๲ு܎਺ XE2ిؾ఻ಋ཰ XE2߶ੑ཰ XE2ՙॏͨΘΈԹ౓ XE2೤తಛੑ- XE2సҠԹ౓ XE2೘ૉ XE2ۂ໘ XE2㔸ੑ XE2ൺ೤༰ྔ XE2ൺྔ XE2٬ମ XE2ಛ௃ྔ- XE2ಶ఺ XE2ϙϦΤεςϧ XE2߹੒ણҡ XE2ϩοΫ΢Σϧߗ͞ XE2࣍ݩଟ༷ମ XE2Ձ XE2νΦ೘ૉ XE2ۚଐՃ޻ XE2஋- XE2ӡಈ XE2ۭ࣮࣌ؒମ XE2෍ XE2ϥΫτϯ XE2ΦΩααΠΫϧ XE2ϙϦγϩΩαϯ XE2ΠϯϔϨϯτ೪౓ XE2֦ࢄ܎਺ XE2෇Ճॏ߹ XE2մঢ়ॏ߹ XE2ϙϦΧʔϘωʔτ XE2஌ࣝ૊৫Խମܥ XE2֓೦ମܥ- XE2ϦϯԽ߹෺ XE2QIZTJDBMJOUFSGBDF XE2਺ࣜ XE2೤๲ு XE2ॏ߹౓ XE2OPOCJPMPHJDBMDPNQPOFOU XE2ߏ੒ཁૉ- XE2ߏ଄- XE2έΠૉ XE2OBNJOHDPOWFOUJPO XE2ྗ- XE2༗ػෳૉ؀Խ߹෺ XE2༗ػࢎૉԽ߹෺- XE2ϙϦϗεϑΝθϯ XE2εϧϑΟυ XE2೤఻ಋ XE2ಁա܎਺ XE2୯݁থ XE2෺ཧతϓϩηε- XE2ޙॲཧ XE2Ξϛϊࢎ XE2༗ػࢎ- XE2ϙϦεϧϑΟυ XE2UFDIOPMPHJDBMDPNQPOFOU XE2ঢ়ଶ- XE2ਤܗ XE2ޠ XE2ΨϥεసҠ఺ XE2໊લ XE2ओମ XE2UFSNJOPMPHZ XE2ήϧਁಁΫϩϚτάϥϑΟʔ XE2༠ಋମ XE2఺܈ XE2Ծൺॏ XE2ѹॖ཰ XE2։؀ॏ߹ XE2ݒ୙ॏ߹ XE2ϥδΧϧॏ߹- XE2ք໘ XE2଱೤ੑ XE2۶ંܭ XE2ܭଌػث- XE2࣮ݧث۩- XE2਺ฏۉ෼ࢠྔ XE2ೕԽॏ߹ XE2ޫֶݦඍڸ XE2׳༻໊ XE2෸఺্ঢ XE2ࢷ๱଒Խ߹෺- XE2ϙϦΠϛϯ XE2ϙϦδΤϯ XE2ϙϦϋϩΦϨϑΟϯ XE2ϙϦϚʔ࠯ XE2ϥϯμϜߏ଄ XE2݁থԽ࣌ؒ XE2ΞΠκουিܸ஋ XE2ྟք֯ํࣜͷ۶ંܭ XE2ΧνΦϯॏ߹ XE2ΞχΦϯॏ߹ XE2ΞχϦϯ༠ಋମ XE2ΞϛϊΧϧϘϯࢎ XE2ΦΩγΧϧϘϯࢎ XE2Ψε֦ࢄ܎਺ XE2Ψεಁա܎਺ XE2Ψε༹ղ౓ XE2ΫϦʔϓಛੑ XE2%/"ͷΞχʔϦϯά XE2DPMMFDUJPOFOUJUZ 起点となる共通エンティティ中間エンティティ検索エンティティ起点となる共通エンティティ（展開共通上位エンティティ） 144エンティティ各展開段数上位概念グラフの部分構造得られたクラス階層の上位関係 XE2Ξϧσώυ XE2Խ߹෺ͷߏ଄Ϋϥε- XE2ΧϧϘχϧԽ߹෺- XE2༥ղ XE2૬సҠ- XE2ࢷ࣭ XE2༗ػԽ߹෺- XE2ੜ෺ߴ෼ࢠ XE2ྲྀಈੑ ߹੒थࢷ XE2ॏ߹։࢝ࡎ XE2Խ߹෺- XE2ϙϦΧϧϘϯࢎ XE2ΧϧϘϯࢎ- XE2έΠૉԽ߹෺ XE2ΞηνϨϯ XE2Մ೩ੑΨε- XE2ΞϧΩϯ XE2ॏ߹ମ- XE2Πϛυ XE XE2࠯ࣜԽ߹෺ XE2ΞηνϨϯ XE2Ҡಈ XE2มԽ- XE2ߦಈ- XE2ΞχϦϯ XE2ൃ؞ੑ- XE2๕߳଒Խ߹෺- XE2Ϋϥε***"Մ೩ੑӷମ XE2ϙϦΤεςϧ XE2Τεςϧ- XE2มܗ XE2$MBTT*$GMBNNBCMFMJRVJE XE2ҾՐੑӷମ- XE2$MBTT**DPNCVTUJCMFMJRVJE XE2ϝϥϛϯ XE2ෳૉ؀ࣜԽ߹෺- XE2ෆ๞࿨ࢷ๱ࢎ XE2ෆ๞࿨݁߹- XE2๕߳଒୸Խਫૉ XE2ෆ๞࿨୸Խਫૉ- XE2๞࿨ਫૉԽέΠૉ XE2δΞϛϯ XE2Ξϛϯ- XE2ϥΫλϜ XE2Ξϛυ- XE2ενϨϯ XE2ΞΫϦϧࢎ XE2ΧϧϘϯࢎΤεςϧ XE2ΧϧϘϯࢎԘ- XE2ϗεϑΝθϯ XE2Πϛϯ XE2ΠιγΞωʔτ XE2εϧϗΩγυ XE2ࢎૉԽ߹෺- XE2ϙϦΞΫϦϧࢎ XE2εϧϗϯ XE2TVMGPOZMDPNQ XE2 XE2 XE2δΧϧϘϯࢎ XE2ࢷ๱Ξγϧ XE2νΦΤεςϧ XE2΢Ϩλϯ XE XE2γϩΩαϯ XE2ՙॏͨΘΈԹ౓ XE2సҠԹ౓ XE2೘ૉ XE2νΦ೘ૉ XE2ӡಈ XE2ϥΫτϯ XE2ΦΩααΠΫϧ XE2ϙϦγϩΩαϯ XE2ϦϯԽ߹෺ XE2༗ػෳૉ؀Խ߹෺ XE2෺ཧతϓϩηε- XE2Ξϛϊࢎ XE2༗ػࢎ- XE2 XE2ΨϥεసҠ఺ XE2ࢷ๱଒Խ߹෺- XE2ΞϛϊΧϧϘϯࢎ XE2ΦΩγΧϧϘϯࢎ XE2ΫϦʔϓಛੑ エステル

得られた起点となる共通エンティティと展開段数（展開段数１）化学反応ラジカル重合アミンビニル⾼分⼦重合反応エーテル可燃性ガス分⼦
液体無次元量粘度合成樹脂ケトン化学物質のグループまたはクラス指数発癌性弾性率化学過程結晶化⽣物学的プロセスコンバータイオン糖アルコール有機酸有機硫⻩化合物炭化⽔素化学薬品の専⾨的使⽤係数有機窒素化合物熱的特性イオンの構造クラス化学的性質逐次重合有機⾼分⼦（展開段数２）重合体物性物理量材料特性物理単位特徴量物理現象化合物エステル⽔素化物プロセス⼒物質の状態固体オレフィングリセリドの含有量モル量光学機器診断⾏為スカラー相転移アミド芳⾹族化合物計測機器系列可燃性固体物理的状態状態量⼀時的な実体材料 ISQ派⽣数量実験技術⽰強変数⽐カルボン酸塩⾏為分析技術酸素化合物引⽕性液体材料の機械的性質構造⾯量個体量化学量有機酸素化合物硫⻩化合物実験器具分離⼯学不飽和結合束縛状態カルボニル化合物（展開段数３）有機化合物脂肪族化合物複素環式化合物可鍛性材料不飽和炭化⽔素関数構成要素カルボン酸第⼆可算的空間概念群クラスメタクラス表記法多様体語彙項⽬量ハウスドルフ空間規準化合物の構造クラス（展開段数４）⾼分⼦物理的プロセス変化⾔語装置構成素位相空間⾔語単位タイプ数学的対象技術状態連続媒体空間特性（展開段数５）化学物質情報規則部分集合分⼦実体集合概念体系値抽象的対象関係性⾏動（展開段数６）産物部分⼈造実体射素材認識物体表現（展開段数７）命題商品システム⼈⼯物（展開段数８）財過程（１０）知識

起点となる共通エンティティ 144エンティティ展開段数ごとの共通エンティティ数共通エンティティ数起点となる共通エンティティから下位概念の検索プロパティのパスを利⽤した下位概念のSPARQL検索の代表例

概念数取得できるユニーク概念数の積算グラフ得られた概念数 1,139,820 ※重複概念を除外した。起点となる共通エンティティから取得できる概念数⾼分⼦オントジーの候補語彙展開段数ごとで取得できる
概念の合計概念数 (50万) 「化合物」の下位概念 ※展開段数ごとで取得できる概念の重複を除外していない。

⾼分⼦オントロジーで定義すべき候補語彙の評価（⽬的）展開段数の閾値を考慮して、対象ドメインに関係ない語彙を除去して、候補語彙を絞り込む。（評価法）⾼分⼦に関する単語群を「正解データ」として与えて、その語彙を含む割合で展開段数の閾値を判定する。対象書籍:
⾼分⼦辞典第３版（⾼分⼦学会）和⽂索引: 6739 欧⽂索引: 4521 （記号/略語を含む）辞典索引集の光学的⽂字認識(OCR) Wikidataとリンキングできた語彙(⽇本語) 1987語（正解データ）

展開段数の閾値による候補語彙の絞り込み展開段数 X （1-Xまで）起点の数得られた候補語彙数抽出された正解データ数正解データが抽
出できた割合 (%) ※ 1 34 46796 160 8.05 2 85 580148 484 24.36 3 105 792839 611 30.75 4 119 838980 738 37.14 5 130 914151 820 41.27 6 137 1030334 962 48.41 7 141 1048991 970 48.82 8 143 1091829 992 49.92 9 143 1091829 992 49.92 10 144 1139820 1008 50.73 正解データが候補概念として抽出できた割合 % 正解データが抽出できた割合は展開段数６以降で鈍化した。展開段数６段までで得られた候補語彙が有⼒。 ※正解データが抽出できた割合 : 抽出された正解データ数 ➗ 全正解データ数

まとめ・今後の展望 n Wikidataから、対象ドメインに関する約100万語の概念のクラス階層を抽出できた。 n ⼊⼒語彙数（〜1000語彙）を増やした場合の検証実験を⾏う。 • 起点数が増えることで、展開段数は⼩さくなり、検索範囲が絞り込めることが予想される。 •
今後、候補語彙の適合率についても検討する。 n 他の既存DBでの検証 • LSD/Mesh, IOBCなどを⽤いて検証予定 n is-a階層以外の概念関係の取得 • ⾼分⼦と関連する概念関係を取得する⽅法を試⾏中 n LODあるいはLODのサブセクション（化学/医学等）によって、クラス、及びインスタンスの取り扱いが異なるので、今後検討する。 n ⾃動抽出した内容を「⾼分⼦オントロジー」として整備する。

高分子材料オントロジーの構築に向けた Wikidataからのドメイン概念抽出

高分子材料オントロジーの構築に向けた Wikidataからのドメイン概念抽出

skume

More Decks by skume

Other Decks in Research

Featured

Transcript

⾼分⼦材料オントロジーの構築に向けた Wikidataからのドメイン概念抽出 2020年11⽉20⽇第52回セマンティックウェブとオントロジー研究会⼈⼯知能学会研究会 SIG-SWO-052-03 Extraction of Domain Concepts

展開段数１展開段数２（⼊⼒）・検索エンティティ（）（出⼒）・展開共通上位エンティティ

提案⼿法による⾼分⼦オントロジー構築の実施例⾼分⼦データベースPoLyInfoからの語彙収集⾼分⼦に関わるドメイン語彙 515語彙 Wikidataとのリンキング対象ドメインに関する 188 エンティティワークフロー

Wikidataのクラス階層に関するデータモデル QID: wikidataのエンティティID subClassOf: wdt:P279, instanceOf: wdt:P31 Wikidataのデータモデル・SPARQL検索モデル QID QID

得られたクラス階層の上位関係対象ドメインに関する 188 検索エンティティ (⼊⼒) XE2Τεςϧ XE2༗ػԽ߹෺ XE2Խ߹෺ͷߏ଄Ϋϥε XE2Ξϧσώυ XE2ΧϧϘχϧԽ߹෺

対象ドメインに関する 188 検索エンティティ (⼊⼒) 上位概念グラフ 709エンティティ/1169トリプル XE2Ξϧσώυ XE2Խ߹෺ͷߏ଄Ϋϥε- XE2ΧϧϘχϧԽ߹෺- XE2$"4ొ࿥൪߸

得られた起点となる共通エンティティと展開段数（展開段数１）化学反応ラジカル重合アミンビニル⾼分⼦重合反応エーテル可燃性ガス分⼦

起点となる共通エンティティ 144エンティティ展開段数ごとの共通エンティティ数共通エンティティ数起点となる共通エンティティから下位概念の検索プロパティのパスを利⽤した下位概念のSPARQL検索の代表例

概念数取得できるユニーク概念数の積算グラフ得られた概念数 1,139,820 ※重複概念を除外した。起点となる共通エンティティから取得できる概念数⾼分⼦オントジーの候補語彙展開段数ごとで取得できる

展開段数の閾値による候補語彙の絞り込み展開段数 X （1-Xまで）起点の数得られた候補語彙数抽出された正解データ数正解データが抽