Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
B3勉強会(2015年3月26日)テキストマイニング
Search
MIKAMI-YUKI
March 26, 2015
Education
0
150
B3勉強会(2015年3月26日)テキストマイニング
MIKAMI-YUKI
March 26, 2015
Tweet
Share
More Decks by MIKAMI-YUKI
See All by MIKAMI-YUKI
2016年_年次大会_発表資料
mikamiy
0
130
文献紹介_10_意味的類似性と多義解消を用いた文書検索手法
mikamiy
0
330
文献紹介_9_コーパスに基づく動詞の多義解消
mikamiy
0
120
文献紹介_8_単語単位による日本語言語モデルの検討
mikamiy
0
91
文献紹介_7_自動獲得した未知語の読み・文脈情報による仮名漢字変換
mikamiy
0
98
文献紹介_6_複数の言語的特徴を用いた日本語述部の同義判定
mikamiy
0
100
文献紹介_5_マイクロブログにおける感情・コミュニケーション・動作タイプの推定に基づく顔文字の推薦
mikamiy
0
130
文献紹介_4_結合価パターンを用いた仮名漢字変換候補の選択
mikamiy
0
400
文献紹介_3_絵本のテキストを対象とした形態素解析
mikamiy
1
420
Other Decks in Education
See All in Education
2025年度春学期 統計学 第10回 分布の推測とは ー 標本調査,度数分布と確率分布 (2025. 6. 12)
akiraasano
PRO
0
210
技術勉強会 〜 OAuth & OIDC 入門編 / 20250528 OAuth and OIDC
oidfj
5
1.7k
令和政経義塾第2期説明会
nxji
0
160
【品女100周年企画】Pitch Deck
shinagawajoshigakuin_100th
0
5.3k
登壇未経験者のための登壇戦略~LTは設計が9割!!!~
masakiokuda
3
650
シリコンバレーでスタートアップを共同創業したファウンディングエンジニアとしての学び
tomoima525
1
1.1k
情報科学類で学べる専門科目38選
momeemt
0
570
人になにかを教えるときに考えていること(2025-05版 / VRC-LT #18)
sksat
4
1.1k
探査機自作ゼミ2025スライド
sksat
3
740
Interaction - Lecture 10 - Information Visualisation (4019538FNR)
signer
PRO
0
2.1k
データ分析
takenawa
0
14k
Transición del Management al Neuromanagement
jvpcubias
0
170
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
70
11k
Why Our Code Smells
bkeepers
PRO
338
57k
The Cost Of JavaScript in 2023
addyosmani
53
8.8k
It's Worth the Effort
3n
187
28k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
780
How GitHub (no longer) Works
holman
315
140k
How to train your dragon (web standard)
notwaldorf
96
6.2k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.5k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Transcript
長岡技術科学大学 B3 三上侑城 3年勉強会 2015年3月26日 テキストマイニング 自然言語処理研究室 1
テキストマイニングとは 1990年代半ばから広がりはじめた。 複数の文章データの内容を総合的にとら えることで初めて得られる知見を抽出す るための内容分析技術。 2
可能にすること 現在、文章データは毎日膨大に増え続 けている。 情報が多すぎて、目を通せない。 その結果、せっかくの文章データを十分に 活用できない。 ↓ これを打破するのがテキストマイニング 3
可能にすること 膨大な文章データから得られた情報から ・一般消費者の意見が企業活動に反映 されやすくなる。 ・様々な情報を適切に参照できるので、 無駄を削減することができる。 従来、人手で数日かかっていた作業が、 1時間程度に短縮される。 4
基本的な仕組み テキストマイニングは文章中に記述された 内容の統計的な分析であり、 ・内容をいかにして統計的に分析可能な 状態にするか。 ・内容に対して、どの様な統計的分析が 有効か。 が中心的な技術課題となっている。 5
処理の流れ 分析対象のデータを ・形態素解析 ・構文解析 ・文脈分析 ・意味解析 する。この時、 ・カテゴリ辞書 ・同義語辞書 などを使用する。
6
適用事例 コールセンターにおいての使用 企業には様々な問い合わせや注文、 確認、苦情などが寄せられる。 その時に保存される応対の記録は、 ・顧客が何を言ってきて、それに対しどう 対応したか。 ・どのような営業活動に対して顧客がどう 反応したか。 7
適用事例 それまで多くの企業は資源を活用できず、 データが埋もれたままになっていた。 多様な内容を自由に書く形式になるため、 各データを人の手で読むしかなかった。 苦情や要望などを把握することで、トラブ ルの要因の早期発見や顧客の求めてい るものなど、有益な情報が得られる。 8
PCヘルプセンターの事例 PCヘルプセンターのデータ蓄積の主な 目的は、 ・QA再利用による対応時間短縮 ・提携項目の分析に基づいた対応 利用者の満足度を上げるためには、 ・電話がすぐにつながるようにする。 9
PCヘルプセンターの事例 待ち時間を減らすには、 ・個々の問い合わせにかかる時間を短縮。 ・問い合わせ自体を減らす。 ↓ ・オペレータ間で情報を共有し合い、 対応能力を向上させる。 ・問い合わせが不要になるように、製品の 質を高める。 10
PCヘルプセンターの事例 一週間に1万件近い問い合わせ →その分だけ文章データが出来る。 人手では一週間に300件程度しか、処 理・分析ができない。 ↓ 十分な分析ができているとは、言えない 状況であった。 11
PCヘルプセンターの事例 データ処理をおこなった結果、 ・総キーワード数は約150万語 ・語の種類は約10万語 ・その内2回以上使われた単語は 約3万7千語 ・総キーワードの半数以上が760回以上 同じワードが出てきている。 12
PCヘルプセンターの事例 最終的に10回以上出現している、 約1万6千語を辞書に登録した。 登録した内容は、カテゴリ分け、表現分 け、同義表現の集約をおこなった。 13
PCヘルプセンターの事例 先ほどの辞書を使用して、文章データを 分析した。 質問で適切だと分析した回答を、Web 上のFAQのサイトに掲載したところ、以前 と掲載件数は変わらないにもかかわらず、 問題解決率が大きく上がり、Webサポー トの満足度が高くなった。 14
まとめ テキストマイニングは分析志向で、文章 中に記述された内容を単位にして、それ が増えているのか減っている、他の内容と どのような相関を持つかなど、どの様な特 徴があるかを分析し、提示する技術。 これを使うことで、今まで人手では困難 だった大量の文章の分析が、できるように なった。 15
ご視聴ありがとうございました 参考文献 ・テキストマイニングを使う技術/作る技術 著:那須川哲哉 東京電機大学出版局 2006年11月 16