Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Webページ検索結果の絞込みのための記述要素の提示
Search
自然言語処理研究室
March 31, 2010
Research
0
68
Webページ検索結果の絞込みのための記述要素の提示
久保木 武承, 山本 和英. Webページ検索結果の絞込みのための記述要素の提示. 言語処理学会第16回年次大会, pp.278-281 (2010.3)
自然言語処理研究室
March 31, 2010
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
Ankylosing Spondylitis
ankh2054
0
150
生成AI による論文執筆サポート・ワークショップ データ分析/論文ドラフト編 / Generative AI-Assisted Paper Writing Support Workshop: Data Analysis and Drafting Edition
ks91
PRO
0
110
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
210
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
590
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
20
9.8k
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
540
データサイエンティストの業務変化
datascientistsociety
PRO
0
330
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
290
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
3
210
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
420
SkySense V2: A Unified Foundation Model for Multi-modal Remote Sensing
satai
3
700
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
840
Featured
See All Featured
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
240
Between Models and Reality
mayunak
2
250
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
330
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
The Pragmatic Product Professional
lauravandoore
37
7.2k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
280
Claude Code のすすめ
schroneko
67
220k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
890
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
250
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
780
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
410
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Transcript
長岡技術科学大学 久保木武承 山本和英 1 Webページ検索結果の絞り込みの ための記述要素の提示
背景と目的 既存の検索: 検索者が要求する説明があるとは限 らない 本研究の目的: テキスト本文の記述要素を提示する ⇒検索者の要求する説明文を含む ページを検索し易くする 2
コーパス 使い方 クエリ コーパスの使い方を教えてください (質問) コーパス・用例辞典の使い方 (コーパスの使用法) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介
(本の通販) 検索結果 キーワードを抽出 「コーパスとはどんな 使い方をする物ですか?」 質問 3 既存手法 欲しいページは どれ?
「コーパス 使い方」 クエリ コーパスの使い方を教えてください (質問) コーパスとはこういう物です (用語の説明) コーパスの使い方を説明をする 辞典の紹介 (本の通販) 検索先ページ
コーパスの「関連質問」 コーパスの「使い方」 用例辞典の「使い方」 コーパスの「説明」 コーパスの「関連図書」 記述要素 生成 コーパス・用例辞典の使い方 (コーパスの使用法) 生成された記述要素 検索結果 4 -利点- ページの内容にあわせて 検索ができる 提案手法
従来の検索 ・キーワードを含むページの提示 ⇒キーワードさえ含まれていれば、本 文の内容にかかわらず提示する 提案手法 ・ページ本文の内容を表す記述要素を 提示 ⇒文章の内容を考慮した検索結果を 提示 5
理論/まとめ
・記述要素の目的 本文が何を伝えたくて書かれたかを 提示する ・本稿における記述要素の定義 [命題]の<記述要素>は? 例) [コーパス]の<使い方>は? [りんご]の<産地>は? [ローパスフィルタ]の<機能>は? 6
定義/記述要素
Wikipediaの「サブセクション-本文テ キスト」の関係からを利用 本文抽出 形態素解析 本文中の 形態素/上位概念の tfidfを取得 7 手法/記述要素の特徴 記述要素の特徴
として保存
特徴が一致する記述要素を 正解候補として提示 本文中の 形態素/上位概念を取得 8 手法/記述要素の選択 本文抽出 コーパス・用例辞典の 使い方 (コーパスの使用法)
検索結果 ・ ・ ・ 記述要素A 特徴データ 記述要素B 特徴データ 要素の一致数の高い物 を選択
1.Closed test Wikipediaのテキストで記述要素の正解候 補を提示 2.Open test Webから人手で作製した正解セットに対し て記述要素の正解候補を提示 正解セット=(記述要素,本文テキスト)ペア 要素のマッチ数の多い物を
9 実験
問題点 Open testの性能が低すぎる 再現率 適合率 F値 形態素 Closed test 0.96
0.83 0.89 上位概念 Closed test 0.94 0.69 0.80 形態素 Open test 0.02 0.02 0.02 上位概念 Open test 0.03 0.03 0.03 10 結果
課題: Open testにも通用する選択手法が必要 対策: 記述要素の特徴データが不的確? ⇒文の内容を表すより的確な特徴の検討 11 考察