Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理研究室B3ゼミ_02nd
Search
takegue
January 14, 2014
Education
52
0
Share
自然言語処理研究室B3ゼミ_02nd
takegue
January 14, 2014
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
910
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.6k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1.2k
Rettyにおけるデータ活用について
takegue
0
940
Sparse Overcomplete Word Vector Representations
takegue
0
260
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
250
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
140
Dependency-based empty category detection via phrase structure trees
takegue
0
110
Other Decks in Education
See All in Education
Lectura 1 (PIT : Python Basico)
robintux
0
340
Interaction - Lecture 10 - Information Visualisation (4019538FNR)
signer
PRO
0
2.6k
0526
cbtlibrary
0
140
「機械学習と因果推論」入門 ③ 漸近効率な推定量と二重機械学習
masakat0
0
650
小さなまちで始める デジタル創作の居場所〜すべての子どもが創造的に未来を描ける社会へ〜
codeforeveryone
0
530
AWS Certified Generative AI Developer - Professional Beta 不合格体験記
amarelo_n24
1
300
モブ社員がモブエンジニアを名乗って得られたこと_20260413
masakiokuda
4
510
We部コミュニティスライド2026-04-24
junhat6
0
170
Design Guidelines and Principles - Lecture 7 - Information Visualisation (4019538FNR)
signer
PRO
0
3k
Data Processing and Visualisation Frameworks - Lecture 6 - Information Visualisation (4019538FNR)
signer
PRO
1
3.1k
SL AMIGOS 教育格差と私たちの取り組み - スリランカの支援学校への支援プロジェクト:リシンドゥ リオ 氏 (別府溝部学園短期大学 ビジネス観光コース 留学生):2720 Japan O.K. ロータリーEクラブ2026年4月6日卓話
2720japanoke
0
600
AI時代において英語学習は本当に必要? ~未経験からのバイリンガルキャリアの始め方を教えます~
kekekenta
0
190
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
698
190k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
Technical Leadership for Architectural Decision Making
baasie
3
390
Raft: Consensus for Rubyists
vanstee
141
7.5k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
230
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
150
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
Designing for Performance
lara
611
70k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
Claude Code のすすめ
schroneko
67
220k
Building Adaptive Systems
keathley
44
3k
Transcript
自然言語処理研究室 B3 Seminar 2013 年度 第2回 ~機械学習と自然言語処理について~ 長岡技術科学大学 B3 竹野
峻輔
• 計算機が データから規則性や法則性を見出し それ自身をアルゴリズムに反映させること 例えば… 広告(Facebook, Google…) ロボットのバランス制御 天気予報、地震予測などなど 2013/12/24
自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習とは?
• 機械学習(Machine Learning) –既知のデータから法則性を発見し データの予測できるようにすること • データマイニング(Data Mining) –既存のデータから 有益な未知のデータの特徴を発掘すること
2013/1/14 自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習とデータマイニングの違い
• 教師有あり学習(Supervised ML) – 予め用意されたサンプルから法則性を見つける – クラス分類 • (ナイーブベイズ推定、SVM、ニューラルネットワーク) •
教師なし学習(Unsupervised ML) – サンプルなしでデータから法則性を見つける。 – クラスタ分析 • (k-means法、EMアルゴリズム) • 強化学習(Reinforcement ML) – 評価関数からアルゴリズムへフィードバックを行い改良を、 独自に改善を図っていく。 – 自動要約? • TD学習、Q学習 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習の種類
• 教師有あり学習(Supervised ML)(一番やりやすい) – 予め用意されたサンプルから法則性を見つける – クラス分類 • (ナイーブベイズ推定、SVM、ニューラルネットワーク) •
教師なし学習(Unsupervised ML) – サンプルなしでデータから法則性を見つける。 – クラスタ分析 • (k-means法、EMアルゴリズム) • 強化学習(Reinforcement ML) – 評価関数からアルゴリズムへフィードバックを行い改良を、 独自に改善を図っていく。 – 自動要約? • TD学習、Q学習 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習の種類
• 文書(自然言語)そのままでは処理しづらい 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 改めて、機械学習とは? 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回
どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 改めて、機械学習とは? 既知のデータから法則性を発見し データの予測ができるようにすること …未知のデータと既知のデータとの比較が必要 2013/12/24 自然言語処理研究室
2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 改めて、機械学習とは? 既知のデータから法則性を発見し データの予測ができるようにすること …未知のデータと既知のデータとの比較が必要 類似度の計算ができるような値を取り出す 2013/12/24
自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• ベクトル –内積 • 木構造(グラフ)データ – シソーラス • 格フレーム •
確率分布(関数) – 平均値、偏差、歪度、尖度 (モーメント) 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 類似度が計算できるもの(例)
• ベクトル: –Bag-of-words(文書、文比較) • ある単語(方向)の頻度(長さ) Ex) The pen is better
than that pen! ⇒(pen, better, stick) = (2, 1 , 0) –文脈ベクトル(単語の比較) • 空 高く 飛ぶ(名詞 副詞 動詞) ⇒(名詞, 形容詞, 副詞, 動詞, 形容動詞) = (1,0,0,0,1,0) 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 代表的な素性
• 訓練データからクラスの傾向を学習し、 データがどのクラスに所属するか予測する。 not クラスタ解析(≒クラス分析) ・ナイーブベイズ分類器 -条件付き確率を学習 P(c|d) ≌ P(c)P(d|c)
簡単、学習早い、精度それなり ・SVM(Support Vector Machine) -多次元の境界面を学習 -解析的、学習時間かかる、精度高い 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 クラス分類(Classification)のための機械学習
• 奥村学 監修 「言語処理のための機械学習入 門」, 高村大地著 • 機械学習をはじめよう, gihyo.jp, http://gihyo.jp/dev/serial/01/machine-learning
2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 参考文献