Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webページ検索結果の絞込みのための記述要素の提示
Search
自然言語処理研究室
March 31, 2010
Research
68
0
Share
Webページ検索結果の絞込みのための記述要素の提示
久保木 武承, 山本 和英. Webページ検索結果の絞込みのための記述要素の提示. 言語処理学会第16回年次大会, pp.278-281 (2010.3)
自然言語処理研究室
March 31, 2010
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
160
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.6k
「AIとWhyを深堀る」をAIと深堀る
iflection
0
280
ICCV2025参加報告_採択されやすいワークショップの選び方
kobayashi31
0
120
LLM の Attention 機構まとめ — 数式・計算量・メモリ
puwaer
7
1.6k
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
6
4.3k
Dwangoでの漫画データ活用〜漫画理解と動画作成〜@コミック工学シンポジウム2025
kzmssk
0
230
LLMアプリケーションの透明性について
fufufukakaka
0
220
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
210
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
210
コーディングエージェントとABNを再考
hf149
2
260
YOLO26_ Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection
satai
3
500
NII S. Koyama's Lab Research Overview AY2026
skoyamalab
0
180
Featured
See All Featured
Docker and Python
trallard
47
3.8k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
430
The browser strikes back
jonoalderson
0
990
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
530
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
500
Building an army of robots
kneath
306
46k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
130
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
310
Evolving SEO for Evolving Search Engines
ryanjones
0
180
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Transcript
長岡技術科学大学 久保木武承 山本和英 1 Webページ検索結果の絞り込みの ための記述要素の提示
背景と目的 既存の検索: 検索者が要求する説明があるとは限 らない 本研究の目的: テキスト本文の記述要素を提示する ⇒検索者の要求する説明文を含む ページを検索し易くする 2
コーパス 使い方 クエリ コーパスの使い方を教えてください (質問) コーパス・用例辞典の使い方 (コーパスの使用法) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介
(本の通販) 検索結果 キーワードを抽出 「コーパスとはどんな 使い方をする物ですか?」 質問 3 既存手法 欲しいページは どれ?
「コーパス 使い方」 クエリ コーパスの使い方を教えてください (質問) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介 (本の通販) 検索先ページ
コーパスの「関連質問」 コーパスの「使い方」 用例辞典の「使い方」 コーパスの「説明」 コーパスの「関連図書」 記述要素 生成 コーパス・用例辞典の使い方 (コーパスの使用法) 生成された記述要素 検索結果 4 -利点- ページの内容にあわせて 検索ができる 提案手法
従来の検索 ・キーワードを含むページの提示 ⇒キーワードさえ含まれていれば、本 文の内容にかかわらず提示する 提案手法 ・ページ本文の内容を表す記述要素を 提示 ⇒文章の内容を考慮した検索結果を 提示 5
理論/まとめ
・記述要素の目的 本文が何を伝えたくて書かれたかを 提示する ・本稿における記述要素の定義 [命題]の<記述要素>は? 例) [コーパス]の<使い方>は? [りんご]の<産地>は? [ローパスフィルタ]の<機能>は? 6
定義/記述要素
Wikipediaの「サブセクション-本文テ キスト」の関係からを利用 本文抽出 形態素解析 本文中の 形態素/上位概念の tfidfを取得 7 手法/記述要素の特徴 記述要素の特徴
として保存
特徴が一致する記述要素を 正解候補として提示 本文中の 形態素/上位概念を取得 8 手法/記述要素の選択 本文抽出 コーパス・用例辞典の 使い方 (コーパスの使用法)
検索結果 ・ ・ ・ 記述要素A 特徴データ 記述要素B 特徴データ 要素の一致数の高い物 を選択
1.Closed test Wikipediaのテキストで記述要素の正解候 補を提示 2.Open test Webから人手で作製した正解セットに対し て記述要素の正解候補を提示 正解セット=(記述要素,本文テキスト)ペア 要素のマッチ数の多い物を
9 実験
問題点 Open testの性能が低すぎる 再現率 適合率 F値 形態素 Closed test 0.96
0.83 0.89 上位概念 Closed test 0.94 0.69 0.80 形態素 Open test 0.02 0.02 0.02 上位概念 Open test 0.03 0.03 0.03 10 結果
課題: Open testにも通用する選択手法が必要 対策: 記述要素の特徴データが不的確? ⇒文の内容を表すより的確な特徴の検討 11 考察