Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Chainerによる深層学習(3)
Search
youichiro
March 08, 2017
Technology
0
150
Chainerによる深層学習(3)
長岡技術科学大学
自然言語処理研究室
B3ゼミ発表(第7回)
youichiro
March 08, 2017
Tweet
Share
More Decks by youichiro
See All by youichiro
日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成
youichiro
0
1.6k
分類モデルを用いた日本語学習者の格助詞誤り訂正
youichiro
0
100
Multi-Agent Dual Learning
youichiro
1
180
Automated Essay Scoring with Discourse-Aware Neural Models
youichiro
0
120
Context is Key- Grammatical Error Detection with Contextual Word Representations
youichiro
1
140
勉強勉強会
youichiro
0
87
Confusionset-guided Pointer Networks for Chinese Spelling Check
youichiro
0
190
A Neural Grammatical Error Correction System Built On Better Pre-training and Sequential Transfer Learning
youichiro
0
170
An Empirical Study of Incorporating Pseudo Data into Grammatical Error Correction
youichiro
0
200
Other Decks in Technology
See All in Technology
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
370
ACA でMAGI システムを社内で展開しようとした話
mappie_kochi
1
310
20251007: What happens when multi-agent systems become larger? (CyberAgent, Inc)
ornew
1
160
セキュアな認可付きリモートMCPサーバーをAWSマネージドサービスでつくろう! / Let's build an OAuth protected remote MCP server based on AWS managed services
kaminashi
3
270
衛星画像超解像化によって実現する2D, 3D空間情報の即時生成と“AI as a Service”/ Real-time generation spatial data enabled_by satellite image super-resolution
lehupa
0
130
リセラー企業のテクサポ担当が考える、生成 AI 時代のトラブルシュート 2025
kazzpapa3
1
140
AIAgentの限界を超え、 現場を動かすWorkflowAgentの設計と実践
miyatakoji
1
160
【Kaigi on Rails 事後勉強会LT】MeはどうしてGirlsに? 私とRubyを繋いだRail(s)
joyfrommasara
0
220
AI ReadyなData PlatformとしてのAutonomous Databaseアップデート
oracle4engineer
PRO
0
230
Adminaで実現するISMS/SOC2運用の効率化 〜 アカウント管理編 〜
shonansurvivors
4
430
多様な事業ドメインのクリエイターへ 価値を届けるための営みについて
massyuu
1
500
防災デジタル分野での官民共創の取り組み (2)DIT/CCとD-CERTについて
ditccsugii
0
140
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
860
Site-Speed That Sticks
csswizardry
11
890
Gamification - CAS2011
davidbonilla
81
5.5k
Code Review Best Practice
trishagee
72
19k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
RailsConf 2023
tenderlove
30
1.2k
A Tale of Four Properties
chriscoyier
160
23k
Documentation Writing (for coders)
carmenintech
75
5k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Into the Great Unknown - MozCon
thekraken
40
2.1k
Speed Design
sergeychernyshev
32
1.2k
Transcript
Chainerによる深層学習 (3) 平成29年3月9日 長岡技術科学大学 自然言語処理研究室 小川耀一朗
Chainerによる分類問題 1/26
プログラムの全体図 2/26
Irisデータ • 150個のアヤメのデータ • データ: 花びらの長さ、幅、がく片の長さ、幅 • アヤメの種類: setosa(0)、versicolor(1)、virginica(2) 例)
[ 5.0999999 3.5 1.39999998 0.2 ] => 0 [ 7. 3.20000005 4.69999981 1.39999998] => 1 [ 6.30000019 3.29999995 6. 2.5 ] => 2 訓練データ → 奇数番目のデータ75個 テストデータ → 偶数番目のデータ75個 3/26
Irisデータの用意 4/26
Irisデータの用意 Irisデータはscikit-learnに付属しているものを使う scikit-learn: 機械学習ライブラリ 分類や回帰、クラスタリングなどの機能が実装されている 5/26
Irisデータの用意 X : 花のデータ >>>print(X) [[ 5.0999999 3.5 1.39999998 0.2
] [ 4.9000001 3. 1.39999998 0.2 ] … [ 5.9000001 3. 5.0999999 1.79999995]] 6/26
Irisデータの用意 Y : 教師データ >>>print(Y) [0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2] 7/26
Irisデータの用意 Y2 : 教師データ(変形) >>>print(Y2) [[ 1. 0. 0.] [
1. 0. 0.] … [ 0. 0. 1.]] 8/26
訓練データ、テストデータの用意 9/26
訓練データ、テストデータの用意 奇数番目のXデータ → 訓練データ 奇数番目のY2データ → 訓練用の教師データ 10/26
訓練データ、テストデータの用意 偶数番目のXデータ → テストデータ 偶数番目のYデータ → 正解データ 11/26
モデルの定義 12/26
モデルの定義 13 入力:花びらの長さ、幅、がく片の長さ、幅 → 4次元 出力:setosa(0)、versicolor(1)、virginica(2) → 3次元 /26
モデルの定義 14 入力層→中間層:シグモイド関数 中間層→出力層:そのまま 損失関数:二乗誤差 /26
パラメータの学習 15/26
パラメータの学習 16/26
パラメータの学習 17 おまじない /26
パラメータの学習 18 ミニバッチ処理 1回のパラメータ更新にランダムに 取り出した25個の訓練データを使う /26
パラメータの学習 19 5000回繰り返す /26
パラメータの学習 20/26
評価 21/26
評価 22 テストデータをモデルに投入し、予測データを得る テストでは勾配を求める必要はないので Variable変数をvolatile=‘on’にする >>>print(ans) [[ 1.01755786e+00 1.39655769e-02 -2.12547127e-02]
[ 9.83523667e-01 3.55108976e-02 -3.01905852e-02] [ 1.03329992e+00 -1.48231089e-02 -1.54979099e-02] … [ -1.24957561e-01 2.79694885e-01 8.36571217e-01]] /26
評価 23 nrow = 75 ncol = 3 /26
評価 24 予測の最大が正解データと一致したら ok+1 >>>print(“{} {}”.format(ans[30], yans[30])) [ 0.0668037 0.80043787
0.15562642] 1 /26
評価 25/26
発表内容 26 • ChainerによるIrisデータの分類 参考文献 「Chainerによる実践深層学習」第4章 新納 浩幸 著 オーム社
/26