Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webページ検索結果の絞込みのための記述要素の提示
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2010
Research
72
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Webページ検索結果の絞込みのための記述要素の提示
久保木 武承, 山本 和英. Webページ検索結果の絞込みのための記述要素の提示. 言語処理学会第16回年次大会, pp.278-281 (2010.3)
自然言語処理研究室
March 31, 2010
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
500
Recurrent neural network based language model
jnlp
0
170
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
150
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.2k
明日から使える!研究効率化ツール入門
matsui_528
13
7.3k
Sleuthcon Keynote - How Cybercriminals (ab)use AI
fr0gger
0
100
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
840
定数整数除算・剰余算最適化再考
herumi
1
130
長時間動画QAにおけるマルチエージェント推論 ・SVAgent: Storyline-Guided Long Video Understanding via Cross-Modal Multi-Agent Collaboration
murakawatakuya
1
130
R&Dチームを起ち上げる
shibuiwilliam
1
270
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
230
【Zozo Research 技術共有会】三次元領域の現在と展望
mickey_0226
3
380
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
160
National high-resolution cropland classification of Japan with agricultural census information and multi-temporal multi-modality datasets
satai
3
290
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
960
Featured
See All Featured
Designing for Performance
lara
611
70k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
730
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
ラッコキーワード サービス紹介資料
rakko
1
3.7M
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
Ethics towards AI in product and experience design
skipperchong
2
310
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
It's Worth the Effort
3n
188
29k
Docker and Python
trallard
47
3.9k
Facilitating Awesome Meetings
lara
57
7k
Transcript
長岡技術科学大学 久保木武承 山本和英 1 Webページ検索結果の絞り込みの ための記述要素の提示
背景と目的 既存の検索: 検索者が要求する説明があるとは限 らない 本研究の目的: テキスト本文の記述要素を提示する ⇒検索者の要求する説明文を含む ページを検索し易くする 2
コーパス 使い方 クエリ コーパスの使い方を教えてください (質問) コーパス・用例辞典の使い方 (コーパスの使用法) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介
(本の通販) 検索結果 キーワードを抽出 「コーパスとはどんな 使い方をする物ですか?」 質問 3 既存手法 欲しいページは どれ?
「コーパス 使い方」 クエリ コーパスの使い方を教えてください (質問) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介 (本の通販) 検索先ページ
コーパスの「関連質問」 コーパスの「使い方」 用例辞典の「使い方」 コーパスの「説明」 コーパスの「関連図書」 記述要素 生成 コーパス・用例辞典の使い方 (コーパスの使用法) 生成された記述要素 検索結果 4 -利点- ページの内容にあわせて 検索ができる 提案手法
従来の検索 ・キーワードを含むページの提示 ⇒キーワードさえ含まれていれば、本 文の内容にかかわらず提示する 提案手法 ・ページ本文の内容を表す記述要素を 提示 ⇒文章の内容を考慮した検索結果を 提示 5
理論/まとめ
・記述要素の目的 本文が何を伝えたくて書かれたかを 提示する ・本稿における記述要素の定義 [命題]の<記述要素>は? 例) [コーパス]の<使い方>は? [りんご]の<産地>は? [ローパスフィルタ]の<機能>は? 6
定義/記述要素
Wikipediaの「サブセクション-本文テ キスト」の関係からを利用 本文抽出 形態素解析 本文中の 形態素/上位概念の tfidfを取得 7 手法/記述要素の特徴 記述要素の特徴
として保存
特徴が一致する記述要素を 正解候補として提示 本文中の 形態素/上位概念を取得 8 手法/記述要素の選択 本文抽出 コーパス・用例辞典の 使い方 (コーパスの使用法)
検索結果 ・ ・ ・ 記述要素A 特徴データ 記述要素B 特徴データ 要素の一致数の高い物 を選択
1.Closed test Wikipediaのテキストで記述要素の正解候 補を提示 2.Open test Webから人手で作製した正解セットに対し て記述要素の正解候補を提示 正解セット=(記述要素,本文テキスト)ペア 要素のマッチ数の多い物を
9 実験
問題点 Open testの性能が低すぎる 再現率 適合率 F値 形態素 Closed test 0.96
0.83 0.89 上位概念 Closed test 0.94 0.69 0.80 形態素 Open test 0.02 0.02 0.02 上位概念 Open test 0.03 0.03 0.03 10 結果
課題: Open testにも通用する選択手法が必要 対策: 記述要素の特徴データが不的確? ⇒文の内容を表すより的確な特徴の検討 11 考察