Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習とパラメタ調整による学習
Search
youichiro
January 26, 2017
Technology
220
0
Share
機械学習とパラメタ調整による学習
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表1回目
youichiro
January 26, 2017
More Decks by youichiro
See All by youichiro
日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成
youichiro
0
1.6k
分類モデルを用いた日本語学習者の格助詞誤り訂正
youichiro
0
130
Multi-Agent Dual Learning
youichiro
1
200
Automated Essay Scoring with Discourse-Aware Neural Models
youichiro
0
140
Context is Key- Grammatical Error Detection with Contextual Word Representations
youichiro
1
160
勉強勉強会
youichiro
0
100
Confusionset-guided Pointer Networks for Chinese Spelling Check
youichiro
0
210
A Neural Grammatical Error Correction System Built On Better Pre-training and Sequential Transfer Learning
youichiro
0
190
An Empirical Study of Incorporating Pseudo Data into Grammatical Error Correction
youichiro
0
230
Other Decks in Technology
See All in Technology
フロントエンドの相手が変わった - AIが加わったWebの新しいインターフェース設計
azukiazusa1
31
9.6k
AIが書いたコードを信じられない問題 〜レビュー負荷を下げるために変えたこと〜 / The AI Code Trust Gap: Reducing the Review Burden
bitkey
PRO
8
1.4k
ServiceNow Knowledge 26 の歩き方
manarobot
0
320
20年前の「OSS革命」に学ぶ AI時代の生存戦略
samakada
0
530
【技術書典20】OpenFOAM(自宅で深める流体解析)流れと熱移動(2)
kamakiri1225
0
360
バイブコーディングで3倍早く⚪⚪を作ってみた
samakada
0
210
コードや知識を組み込む / Incorporate Code and Knowledge
ks91
PRO
0
210
プラットフォームエンジニアリングの実践 - AWS コンテナサービスで構築する社内プラットフォーム / AWS Containers Platform Meetup #1
literalice
1
240
色を視る
yuzneri
0
310
音声言語モデル手法に関する発表の紹介
kzinmr
0
160
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
450
QAエンジニアはどうやって プロダクト議論の場に入れるのか?
moritamasami
2
340
Featured
See All Featured
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
330
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
Accessibility Awareness
sabderemane
1
110
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
360
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
290
GitHub's CSS Performance
jonrohan
1032
470k
Google's AI Overviews - The New Search
badams
0
990
Writing Fast Ruby
sferik
630
63k
The Invisible Side of Design
smashingmag
302
52k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.9k
KATA
mclloyd
PRO
35
15k
A Tale of Four Properties
chriscoyier
163
24k
Transcript
2017/1/26 B3ゼミ 機械学習とパラメタ調整による学習 ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 ⼩川耀⼀朗 1
機械学習とは • インターネット社会の発展に伴い、コンピュータで扱う ことのできるデータがインターネット上に⼤量に蓄積さ れるようになった • しかしこれらのデータはあまりにも⼤量すぎるため、⼈ 間が⼿作業でデータを閲覧しても、そのままでは役に⽴ つことが少ない •
そこで、こうした⼤量のデータをコンピュータに学習さ せることで、単なる事実の羅列を役に⽴つ知識に変換を ⾏う • このような⽅法をػցֶशと呼ぶ 2
⼈間の学習… • 学校に通って知識を⾝につけたり、物の考え⽅を教わっ たりする • 教えられた知識を元に、⾃ら考えることで⾃分⾃⾝を向 上させる Ø 知識の増加、問題解決能⼒の向上 学習とは
3
機械の学習… • ෦ঢ়ଶͷมԽに着⽬し、何らかの過程によって状態を 変化させる挙動 Ø 機械学習とは ෦ঢ়ଶͷมԽΛੜͤ͡͞ΔΑ͏ͳڍಈ 学習とは 4
• Twitterの 前回ログインからのできごと 機能 ユーザーがTwitterにログインしたとき、重要なニュース やツイートを表⽰する機能に、機械学習技術を⽤いてい る。 • 天気予報への応⽤ 膨⼤なデータから、経験則に基づく処理の⾃動化を⾏う
機械学習は有効 機械学習の例 5
チェッカー(1950年代〜) • ⼈⼯知能の研究として、初期の頃から取り上げられてき た • プログラムに組み込んだ作戦を機械学習を利⽤して調整 することで、⾃律的に強くなる パラメタ調整 過去の⼈間同⼠の対戦結果などを参照して、ある局⾯ で指した着⼿がその後の展開において良い⼿だったか
悪い⼿だったかを評価し、評価が良くなるようにパラ メタを調整する 機械学習の歴史(第1次⼈⼯知能ブーム) 6
エキスパートシステム(1970年代〜) • 特定分野に特化した専⾨知識のデータベースを元に推論 を⾏い、その分野の専⾨家に近い判を下すことができる ⼈⼯知能システム。 • 例えば、病気に関する知識がほとんどない患者が⾃分の 病気を調べるためにエキスパートシステムを使う、と いった、専⾨知識を持たない⼈が専⾨家の助けを借りる 形での利⽤が考えられている。
• χϡʔϥϧωοτϫʔΫが注⽬される 機械学習の歴史(第2次⼈⼯知能ブーム) 7
ニュートラルネットワーク • ⽣物の神経組織の挙動をモデルとして情報処理を⾏う仕組み • ⽣物の神経回路と同じように、セルとセルの間の結合から構成され ている • セルは3つの層に分かれている • セルの間に結合の強さを⽰す結合荷重を与えたものをパーセプトロ
ンと⾔われる 機械学習の歴史(第2次⼈⼯知能ブーム) 8 ⼊ ⼒ 出 ⼒ 刺激層 連想層 応答層
ディープラーニング(2000年代〜) • コンピューターの性能向上により、ニューラルネット ワークの階層を4層、5層と増やし、精度の⾼い機械学習 が実現可能になった • 2010年代からは、Ϗοάσʔλを扱うようになった 機械学習の歴史(第3次⼈⼯知能ブーム) 9
ざっくり3種類 • 教師あり学習 • 教師なし学習 • 強化学習 機械学習の種類 10
問題と答えのセットから傾向を学習し、新しいデータがど こに分類されるか予測する ・分類問題 ・回帰問題 教師あり学習 11
「出⼒すべきもの」があらかじめ決まっていない データの背後に存在する本質的な構造を抽出するために⽤ いられる ・クラスタリング 教師なし学習 12
• 遺伝的アルゴリズムが⽣物集団の進化をモデル化 • ⽣物が環境と相互作⽤し、⽣物の⾏動が環境に適合してい るとใुを得る。 • 報酬に従って内部状態を変更し、環境に適合しようとする Ø 何かがうまくいったらその⽅法をよく使うようにする ⽣物
環境 ⾏動 報酬 報酬が最⼤になるように 内部状態を変更 強化学習 13
実際にパラメタ調整による機械学習をやってみよう インターネットを利⽤すると様々なデータを⼊⼿すること ができる Ø 気象庁のサイトから気象データを⼊⼿ Ø ⻑岡市の年ごとの⽇平均気温データから未来の気温を予 想しよう パラメタ調整による学習 14
⻑岡の気象データ(気象庁>過去の気象データ検索) 15
• 統計的⼿法において、学習データセットとして数値が与 えられた時に、それらの数値を説明できるような数式を 決定することを、ճؼੳという • 回帰分析の代表的な例に、࠷খೋ๏がある • 最⼩⼆乗法を⽤いて⼀次式の係数を求めることで、デー タの関係を機械学習するプログラムを考える 最⼩⼆乗法による予測
16
⽤意: • 最⼩⼆乗法による⼀次式の係数を決定するプログラム:lsm.c • データから必要な⾏のみを取り出すプログラム:selectline.c • データから指定した位置の数値を取り出すプログラム:cutfield.c • ⾏番号をデータファイルに付け加えるプログラム:addnumber.c •
Webサイトからコピーした気象データ:rawdata.txt ⽇平均気温 最⼩⼆乗法による予測 17
1、気象データから⽇平均気温だけを取り出す 2、X軸となる数値を付け加える 3、最⼩⼆乗法により回帰分析を⾏う 最⼩⼆乗法による予測 18
1、気象データから⽇平均気温だけを取り出す ./selectline 2 < rawdata.txt | ./cutfield 5 > data.txt
2N⾏のみを抽出し、5列⽬のみを抽出。data.txtに保存 最⼩⼆乗法による予測 19
2、X軸となる数値を付け加える ./addnumber 1976 < data.txt > lsmdata.txt 1976年から⾏番号を追加し、lsmdata.txtに保存 最⼩⼆乗法による予測 20
3、最⼩⼆乗法により回帰分析を⾏う ./lsm < lsmdata.txt 最⼩⼆乗法による計算式の係数を決定するプログラム に気象データを挿⼊ = 12.206341 + 0.035819
最⼩⼆乗法による予測 21
10.0 10.5 11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5
15.0 1975 1985 1995 2005 2015 図 ⻑岡の年ごとの⽇平均気温の推移 100年後には 約3.6度上昇する!? = 12.206341 + 0.035819x 最⼩⼆乗法による予測 22
• 前年と⽐べて次の年の⽇平均気 温がどうなるかについて、規則 性を学習することを考える • 例えば、平均気温の低い年が続 いたら次の年は気温が上がる、 などの規則性を得る • 前年の気温と⽐べ、上昇してい
るなら+、下降しているならー の記号で表す 1年⽬ 15.4 翌年 15.9 翌々年 15.4 4年⽬ 15.0 上昇:+ 下降:ー 下降:ー 変動傾向の学習 23
⽤意: • 気温の変動を調べるプログラム:updown.c • updown.cを⽤いた年ごとの⽇平均気温データの⽐較結果:pm.txt 変動傾向の学習 24
• 過去3年間のデータ変動パターンを抽出する ⇨ 8パターン • 変動パターンが学習データセットに出現する頻度を数え 上げる 2લ 1લ
ස + + + + + ー + ー + + ー ー ー + + ー + ー ー ー + ー ー ー 変動傾向の学習 25
前年までの変動パターンの結果から 当年の変動を予測するプログラム:ml1.c • 各パターンの出現頻度を数え上げる • 2年前、1年前のパターンから当年の変動を予測する 例: 2લ 1લ
ස + + + 0 + + ー 6 2લ 1લ ස + ー + 9 + ー ー 4 +、+の後は+にならない ⇨ +、+と来たらーと予測する +、ーの後は+が多い ⇨ +、ーと来たら+と予測する 26 変動傾向の学習
7 +65 14032 965 8-7 + 7 +65 14032 965
8-7 + 27 変動傾向の学習
7 +65 14032 965 8-7 + 7 +65 14032 965
8-7 + 2回連続で気温が低下/上昇し た後の予測のように、特徴的 な気温変化を⽰す場合の予測 は良好 ⇨ 気温データの特徴が学習され ている 上昇と下降を繰り返すような 場合は良い予測ができない ⇨ 気温データから注⽬するべき 特徴が⾒つけられなかった 28 変動傾向の学習
• はじめての機械学習 ⼩⾼ 知宏著 オーム社 • 気象庁 http://www.jma.go.jp/jma/index.html 29 参考⽂献