Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
R言語で「言語処理100本ノック 2020」/ NLP100 Rlang
Search
Shotaro Ishihara
May 17, 2020
Technology
0
2.4k
R言語で「言語処理100本ノック 2020」/ NLP100 Rlang
第85回R勉強会@東京(#TokyoR)でのLT資料
https://tokyor.connpass.com/event/176318/
Shotaro Ishihara
May 17, 2020
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
JAPAN AI CUP Prediction Tutorial
upura
1
650
情報技術の社会実装に向けた応用と課題:ニュースメディアの事例から / appmech-jsce 2025
upura
0
310
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
470
Quantifying Memorization in Continual Pre-training with Japanese General or Industry-Specific Corpora
upura
1
83
JOAI2025講評 / joai2025-review
upura
0
1.4k
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
200
JSAI2025 企画セッション「人工知能とコンペティション」/ jsai2025-competition
upura
0
94
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
330
Semantic Shift Stability: 学習コーパス内の単語の意味変化を用いた事前学習済みモデルの時系列性能劣化の監査
upura
0
110
Other Decks in Technology
See All in Technology
Introduction to Bill One Development Engineer
sansan33
PRO
0
360
ZOZOにおけるAI活用の現在 ~開発組織全体での取り組みと試行錯誤~
zozotech
PRO
5
5.5k
量子クラウドサービスの裏側 〜Deep Dive into OQTOPUS〜
oqtopus
0
110
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
570
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.4k
Frontier Agents (Kiro autonomous agent / AWS Security Agent / AWS DevOps Agent) の紹介
msysh
3
170
Digitization部 紹介資料
sansan33
PRO
1
6.8k
生成AI時代にこそ求められるSRE / SRE for Gen AI era
ymotongpoo
5
3.2k
Red Hat OpenStack Services on OpenShift
tamemiya
0
110
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
360
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.9k
Amazon Bedrock Knowledge Basesチャンキング解説!
aoinoguchi
0
140
Featured
See All Featured
Designing for humans not robots
tammielis
254
26k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
270
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2k
Embracing the Ebb and Flow
colly
88
5k
Un-Boring Meetings
codingconduct
0
200
A designer walks into a library…
pauljervisheath
210
24k
How to Ace a Technical Interview
jacobian
281
24k
New Earth Scene 8
popppiees
1
1.5k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Transcript
R⾔語で「⾔語処理100本 ノック 2020」 u++ (@upura0) 第85回R勉強会@東京(#TokyoR) 2020年5⽉23⽇ 1
概要 4⽉に公開された「⾔語処理100本ノック 2020」の紹介 . 2015年からの5年ぶりの改訂の変更点は? . R⾔語で解いてみる $ whoamai Name:
u++ Job: Data Scientist Interest: Kaggle, NLP https://github.com/upura/nlp100v2020 2
⾔語処理100本ノック 東北⼤の乾・鈴⽊研が公開している⾔語処理研究の⼊⾨者向け教材 https://nlp100.github.io/ja/ 3
お品書き 第1章: 準備運動 第2章: UNIXコマンド 第3章: 正規表現 第4章: 形態素解析 第5章:
係り受け解析 第6章: 機械学習 第7章: 単語ベクトル 第8章: ニューラルネット 第9章: RNN,CNN 第10章: 機械翻訳 4
改訂の変更点 深層ニューラルネットワークに関する問題を追加 多⾔語対応 英語版の公開(39番まで翻訳完了) 旧第6章(英語テキストの処理)を英語版に移動 https://nlp100.github.io/ja/about.html 5
内容の⽐較 章 2020年版 2015年版との差異 1 準備運動 - 2 UNIXコマンド -
3 正規表現 - 4 形態素解析 - 5 係り受け解析 - 6
章 2020年版 2015年版との差異 6 機械学習 第8章から移動 7 単語ベクトル 第9, 10章から移動
8 ニューラルネット 9 RNN,CNN 10 機械翻訳 https://qiita.com/hi-asano/items/3c17943ce06f9999ec6f 7
所感 2018年に「BERT」が登場するなど、近年の⾔語処理を語る 上で⽋かせない深層ニューラルネットワークの問題を新設 ⼀⽅でニューラルネットの実装や計算量の都合で、R⾔語だと 厳しそうな場⾯も・・・ 8
R⾔語で解いてみる https://nlp100.github.io/ja/ch01.html 9
おわりに 4⽉に公開された「⾔語処理100本ノック 2020」の紹介 . 2015年からの5年ぶりの改訂の変更点は? . R⾔語で解いてみる https://www.kaggle.com/sishihara/nlp100-rlang-sample 10