Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webページ検索結果の絞込みのための記述要素の提示
Search
自然言語処理研究室
March 31, 2010
Research
0
49
Webページ検索結果の絞込みのための記述要素の提示
久保木 武承, 山本 和英. Webページ検索結果の絞込みのための記述要素の提示. 言語処理学会第16回年次大会, pp.278-281 (2010.3)
自然言語処理研究室
March 31, 2010
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
330
データサイエンス13_解析.pdf
jnlp
0
380
データサイエンス12_分類.pdf
jnlp
0
290
データサイエンス11_前処理.pdf
jnlp
0
400
Recurrent neural network based language model
jnlp
0
100
自然言語処理研究室 研究概要(2012年)
jnlp
0
100
自然言語処理研究室 研究概要(2013年)
jnlp
0
69
自然言語処理研究室 研究概要(2014年)
jnlp
0
64
自然言語処理研究室 研究概要(2015年)
jnlp
0
120
Other Decks in Research
See All in Research
Source Code Diff Revolution (JetBrains Open Reading Club)
tsantalis
0
250
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations
rudorudo11
0
160
精神疾患患者のアクティビティデータを利用したリハビリテーションのためのシステムに関する研究
comfortdesignlab
0
140
LiDARセキュリティ最前線
kentaroy47
0
270
People Driven Transformation / 人が起点の、社会の変え方
dmattsun
0
150
SANER 2019 Most Influential Paper Talk
tsantalis
0
120
Evolutionary Optimization ofModel Merging Recipes (2024/04/17, NLPコロキウム)
iwiwi
5
1.6k
「EBPMエコシステム」の可能性
daimoriwaki
0
200
訓練データ作成のためのCloudCompareを利用した点群の手動ラベリング
kentaitakura
0
510
第12回全日本コンピュータビジョン勉強会:画像の自己教師あり学習における大規模データセット
naok615
0
500
3D Human Mesh Estimationについていくつかまとめてみた / Survey about 3D Human Mesh Estimation
nttcom
0
180
研究効率化Tips_2024 / Research Efficiency Tips 2024
ryo_nakamura
4
2.1k
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
353
18k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
320
20k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
18
1.7k
Reflections from 52 weeks, 52 projects
jeffersonlam
343
19k
Optimizing for Happiness
mojombo
369
69k
How STYLIGHT went responsive
nonsquared
92
4.8k
Web development in the modern age
philhawksworth
201
10k
Git: the NoSQL Database
bkeepers
PRO
421
63k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
1
1.3k
GraphQLとの向き合い方2022年版
quramy
30
12k
Designing for humans not robots
tammielis
247
25k
How to train your dragon (web standard)
notwaldorf
71
5.1k
Transcript
長岡技術科学大学 久保木武承 山本和英 1 Webページ検索結果の絞り込みの ための記述要素の提示
背景と目的 既存の検索: 検索者が要求する説明があるとは限 らない 本研究の目的: テキスト本文の記述要素を提示する ⇒検索者の要求する説明文を含む ページを検索し易くする 2
コーパス 使い方 クエリ コーパスの使い方を教えてください (質問) コーパス・用例辞典の使い方 (コーパスの使用法) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介
(本の通販) 検索結果 キーワードを抽出 「コーパスとはどんな 使い方をする物ですか?」 質問 3 既存手法 欲しいページは どれ?
「コーパス 使い方」 クエリ コーパスの使い方を教えてください (質問) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介 (本の通販) 検索先ページ
コーパスの「関連質問」 コーパスの「使い方」 用例辞典の「使い方」 コーパスの「説明」 コーパスの「関連図書」 記述要素 生成 コーパス・用例辞典の使い方 (コーパスの使用法) 生成された記述要素 検索結果 4 -利点- ページの内容にあわせて 検索ができる 提案手法
従来の検索 ・キーワードを含むページの提示 ⇒キーワードさえ含まれていれば、本 文の内容にかかわらず提示する 提案手法 ・ページ本文の内容を表す記述要素を 提示 ⇒文章の内容を考慮した検索結果を 提示 5
理論/まとめ
・記述要素の目的 本文が何を伝えたくて書かれたかを 提示する ・本稿における記述要素の定義 [命題]の<記述要素>は? 例) [コーパス]の<使い方>は? [りんご]の<産地>は? [ローパスフィルタ]の<機能>は? 6
定義/記述要素
Wikipediaの「サブセクション-本文テ キスト」の関係からを利用 本文抽出 形態素解析 本文中の 形態素/上位概念の tfidfを取得 7 手法/記述要素の特徴 記述要素の特徴
として保存
特徴が一致する記述要素を 正解候補として提示 本文中の 形態素/上位概念を取得 8 手法/記述要素の選択 本文抽出 コーパス・用例辞典の 使い方 (コーパスの使用法)
検索結果 ・ ・ ・ 記述要素A 特徴データ 記述要素B 特徴データ 要素の一致数の高い物 を選択
1.Closed test Wikipediaのテキストで記述要素の正解候 補を提示 2.Open test Webから人手で作製した正解セットに対し て記述要素の正解候補を提示 正解セット=(記述要素,本文テキスト)ペア 要素のマッチ数の多い物を
9 実験
問題点 Open testの性能が低すぎる 再現率 適合率 F値 形態素 Closed test 0.96
0.83 0.89 上位概念 Closed test 0.94 0.69 0.80 形態素 Open test 0.02 0.02 0.02 上位概念 Open test 0.03 0.03 0.03 10 結果
課題: Open testにも通用する選択手法が必要 対策: 記述要素の特徴データが不的確? ⇒文の内容を表すより的確な特徴の検討 11 考察