Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理研究室B3ゼミ_02nd
Search
takegue
January 14, 2014
Education
0
42
自然言語処理研究室B3ゼミ_02nd
takegue
January 14, 2014
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
900
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.5k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1.1k
Rettyにおけるデータ活用について
takegue
0
930
Sparse Overcomplete Word Vector Representations
takegue
0
260
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
240
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
130
Dependency-based empty category detection via phrase structure trees
takegue
0
100
Other Decks in Education
See All in Education
滑空スポーツ講習会2025(実技講習)EMFT学科講習資料/JSA EMFT 2025
jsaseminar
0
300
JAPAN AI CUP Prediction Tutorial
upura
2
910
Going over the Edge
jonoalderson
0
760
資格支援制度-株式会社HIT
kabushikigaisya_hit
0
520
2026 Medicare 101 Presentation
robinlee
PRO
0
190
The browser strikes back
jonoalderson
0
800
Data Representation - Lecture 3 - Information Visualisation (4019538FNR)
signer
PRO
1
2.9k
Data Presentation - Lecture 5 - Information Visualisation (4019538FNR)
signer
PRO
0
3k
LotusScript でエージェント情報を出力してみた
harunakano
0
150
Information Architectures - Lecture 2 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
1.9k
Pen-based Interaction - Lecture 4 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.1k
SSH公開鍵認証 / 02-b-ssh
kaityo256
PRO
0
110
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
A designer walks into a library…
pauljervisheath
210
24k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
63
51k
Design in an AI World
tapps
0
170
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
320
The Cost Of JavaScript in 2023
addyosmani
55
9.8k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Claude Code のすすめ
schroneko
67
220k
Faster Mobile Websites
deanohume
310
31k
Thoughts on Productivity
jonyablonski
75
5.1k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Transcript
自然言語処理研究室 B3 Seminar 2013 年度 第2回 ~機械学習と自然言語処理について~ 長岡技術科学大学 B3 竹野
峻輔
• 計算機が データから規則性や法則性を見出し それ自身をアルゴリズムに反映させること 例えば… 広告(Facebook, Google…) ロボットのバランス制御 天気予報、地震予測などなど 2013/12/24
自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習とは?
• 機械学習(Machine Learning) –既知のデータから法則性を発見し データの予測できるようにすること • データマイニング(Data Mining) –既存のデータから 有益な未知のデータの特徴を発掘すること
2013/1/14 自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習とデータマイニングの違い
• 教師有あり学習(Supervised ML) – 予め用意されたサンプルから法則性を見つける – クラス分類 • (ナイーブベイズ推定、SVM、ニューラルネットワーク) •
教師なし学習(Unsupervised ML) – サンプルなしでデータから法則性を見つける。 – クラスタ分析 • (k-means法、EMアルゴリズム) • 強化学習(Reinforcement ML) – 評価関数からアルゴリズムへフィードバックを行い改良を、 独自に改善を図っていく。 – 自動要約? • TD学習、Q学習 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習の種類
• 教師有あり学習(Supervised ML)(一番やりやすい) – 予め用意されたサンプルから法則性を見つける – クラス分類 • (ナイーブベイズ推定、SVM、ニューラルネットワーク) •
教師なし学習(Unsupervised ML) – サンプルなしでデータから法則性を見つける。 – クラスタ分析 • (k-means法、EMアルゴリズム) • 強化学習(Reinforcement ML) – 評価関数からアルゴリズムへフィードバックを行い改良を、 独自に改善を図っていく。 – 自動要約? • TD学習、Q学習 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 機械学習の種類
• 文書(自然言語)そのままでは処理しづらい 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 改めて、機械学習とは? 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回
どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 改めて、機械学習とは? 既知のデータから法則性を発見し データの予測ができるようにすること …未知のデータと既知のデータとの比較が必要 2013/12/24 自然言語処理研究室
2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• 文書(自然言語)そのままでは処理しづらい ⇒具体的な数値(素性抽出)を知る必要がある。 ⇒どのようなことに気を付ければよいだろうか? 改めて、機械学習とは? 既知のデータから法則性を発見し データの予測ができるようにすること …未知のデータと既知のデータとの比較が必要 類似度の計算ができるような値を取り出す 2013/12/24
自然言語処理研究室 2013年度 B3コアタイム 第2回 どうやって自然言語処理に対応するか?
• ベクトル –内積 • 木構造(グラフ)データ – シソーラス • 格フレーム •
確率分布(関数) – 平均値、偏差、歪度、尖度 (モーメント) 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 類似度が計算できるもの(例)
• ベクトル: –Bag-of-words(文書、文比較) • ある単語(方向)の頻度(長さ) Ex) The pen is better
than that pen! ⇒(pen, better, stick) = (2, 1 , 0) –文脈ベクトル(単語の比較) • 空 高く 飛ぶ(名詞 副詞 動詞) ⇒(名詞, 形容詞, 副詞, 動詞, 形容動詞) = (1,0,0,0,1,0) 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 代表的な素性
• 訓練データからクラスの傾向を学習し、 データがどのクラスに所属するか予測する。 not クラスタ解析(≒クラス分析) ・ナイーブベイズ分類器 -条件付き確率を学習 P(c|d) ≌ P(c)P(d|c)
簡単、学習早い、精度それなり ・SVM(Support Vector Machine) -多次元の境界面を学習 -解析的、学習時間かかる、精度高い 2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 クラス分類(Classification)のための機械学習
• 奥村学 監修 「言語処理のための機械学習入 門」, 高村大地著 • 機械学習をはじめよう, gihyo.jp, http://gihyo.jp/dev/serial/01/machine-learning
2013/12/24 自然言語処理研究室 2013年度 B3コアタイム 第2回 参考文献