Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自然言語処理研究室B4ゼミ_04th

takegue
March 13, 2014

 自然言語処理研究室B4ゼミ_04th

takegue

March 13, 2014
Tweet

More Decks by takegue

Other Decks in Technology

Transcript

  1. • R. Schwitter, “Controlled natural languages for knowledge representation,” in

    Proceedings of the 23rd International Conference on Computational Linguistics: Posters, 2010, no. August, pp. 1113–1121. • Abstract: This paper presents a survey of research in controlled natural languages that can be used as high-level knowledge representa- tion languages. Over the past 10 years or so, a number of machine-oriented con- trolled natural languages have emerged that can be used as high-level interface languages to various kinds of knowledge systems. These languages are relevant to the area of computational linguistics since they have two very interesting properties: firstly, they look informal like natural lan- guages and are therefore easier to write and understand by humans than formal languages; secondly, they are precisely defined subsets of natural languages and can be translated automatically (and often deterministically) into a formal target lan- guage and then be used for automated rea- soning. We present and compare the most mature of these novel languages, show how they can balance the disadvantages of natural languages and formal languages for knowledge representation, and discuss how domain specialists can be supported writing specifications in controlled natural language. 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ Controlled Natural Languages for Knowledge Representation
  2. • 自然言語(Natrural Languages) – 人間に理解しやすい – 機械的に処理するには難しい • 形式言語(Formal Languages)

    – 機械的に処理するために作られた – 人間的な表現ではないことが多いため理解し辛い → 制限言語(Controlled Natural Languages) – 曖昧性・複雑性が体系的に制限された言語 • 人間的にも機械的にも理解させやすい! 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. Introduction – CNLとは何か?
  3. • 自然言語(Natrural Languages) – 人間に理解しやすい – 機械的に処理するには難しい • 形式言語(Formal Languages)

    – 機械的に処理するために作られた – 人間的な表現ではないことが多いため理解し辛い → 制限言語(Controlled Natural Languages) – 曖昧性・複雑性が体系的に制限された言語 • 人間的にも機械的にも理解させやすい! 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. Introduction – CNLとは何か?
  4. • Chapter 1:導入 • Chapter 2:汎用的なCNLの例 • Chapter 3:CNLの理論的問題点とその考察 •

    Chapter 4:the Semantic WebのためのCNL • Chapter 5:CNL記述のためのツール • Chapter 6:CNLのための書きやすさ・可読性 の評価手法 • Chapter 7:結論 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. Introducntion – 論文の構成 -
  5. • 自然言語(Natrural Languages) – 人間に理解しやすい – 機械的に処理するには難しい • 形式言語(Formal Languages)

    – 機械的に処理するために作られた – 人間的な表現ではないことが多いため理解し辛い → 制限言語(Controlled Natural Languages) – 曖昧性・複雑性が体系的に制限された言語 • 人間的にも機械的にも理解させやすい! 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. Introduction – CNLとは何か?
  6. 制限言語(Controlled Natural Languages) – 曖昧性・複雑性が体系的に制限された言語 • 人間的にも機械的にも理解させやすい! • 人間志向のCNL(Human-oriented CNLs)

    • 取扱説明書などの可読性を高めるための言語 • 機械志向のCNL(Machine-oriented CNLs) • 自動翻訳しやすい言語.翻訳性の高い言語 • 知識の獲得・表現・処理がしやすい言語 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. Introduction – 2種のCNL
  7. • Gneleral-Purpose CNL 読みやすくて・使いやすくて・処理しやすいCNL 特定の目的のために特化していない – ACE(Attempt Controlled English) •

    少数の機能語(predefined words)・定型文・その他の単語か らなる – PENG(Processable English) • ACEの改良版(より小規模で多くの用途に使える) • 参照確定節文法 (DCG) をtop-down木として定義 – CPL(Computer Processable Language) • ACEの改良版. • 文法が制限されたもの.非常に計算機的に処理しやすい • bottom-upでCPLのparseを行う。 – CPL-Liteなども存在する 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 2. General-Purpose CNLs (多目的制限言語)
  8. • ACE View – OWLとSWRLに変換可能なACEのサブセットCNLを作る ためのエディタ • Sydeny OWL Syntax

    – PENG をもとに構築されたOWL-DLに相互変換可能な CNL • Line Natural Language • CLOnE ・・・etc 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.CNLs for the Semantic Web セマンティック・ウェブ(英: semantic web)は W3C のティム・バーナーズ=リーによって提唱された、ウェブページの意味を扱うこと を可能とする標準やツール群の開発によってワールド・ワイド・ウェブ[1]の利便性を向上させるプロジェクト。セマンティック・ウェブの 目的はウェブページの閲覧という行為に、データの交換の側面に加えて意味の疎通を付け加えることにある。 現在のワールド・ワイド・ウェブ上のコンテンツは主にHTMLで記述されている。HTMLでは文書構造を伝えることは可能だが、個々 の単語の意味をはじめとする詳細な意味を伝えることはできない。これに対し、セマンティック・ウェブはXMLによって記述した文書に RDFやOWLを用いてタグを付け加える。この、データの意味を記述したタグが文書の含む意味を形式化し、コンピュータによる自動 的な情報の収集や分析へのアプローチが可能となると期待されている。 - Wikipedia セマンティック ・ウェブ より引用 CNLを使ったオントロジー構築
  9. 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5.Writing Support for CNLs •

    CNLの記述にはサポートツールが必須 – 語彙・構文等が制限されているため • CNLの記述サポートのための3要素 – エラーメッセージ(Error message) • 何がCNLに準拠していないかをハッキリ明確に示す – 概念に関する記述(Conceptual authoring) • 意味階層に基づいた知識ベース記述のための技術 • 概念がどのようなカテゴリ構造(ヒエラルキー)になっているか • この文体の時はどういった構造になっているかを示す – テキストの予測補完(Predictive feedback) • CNLに沿った構文に誘導できるようにユーザへ CNLに沿った文法の候補を出力する
  10. • CNLの使いやすさをはかる3つの手法 – Task-based の評価 • 被験者にCNLを補助ツール付で使ってみてもらう • 主に書きやすさの評価(可読性が評価されない) –

    Paraphrase-based の評価 • 主に可読性(CNLの表現力)の評価 • CNLで記述された表現を自然言語の表現から選ぶ – Graph-based の評価 • 絵と状況を記述した文をセットとして 絵に対して、記述されたどの文が合っているか間違って いるかを判断してもらう 2014/3/14 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 6.Evaluating CNLs – 制限言語の評価