Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
R言語で「言語処理100本ノック 2020」/ NLP100 Rlang
Search
Shotaro Ishihara
May 17, 2020
Technology
0
2.3k
R言語で「言語処理100本ノック 2020」/ NLP100 Rlang
第85回R勉強会@東京(#TokyoR)でのLT資料
https://tokyor.connpass.com/event/176318/
Shotaro Ishihara
May 17, 2020
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
JOAI2025講評 / joai2025-review
upura
0
140
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
0
86
JSAI2025 企画セッション「人工知能とコンペティション」/ jsai2025-competition
upura
0
36
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
160
Semantic Shift Stability: 学習コーパス内の単語の意味変化を用いた事前学習済みモデルの時系列性能劣化の監査
upura
0
27
日本語ニュース記事要約支援に向けたドメイン特化事前学習済みモデルの構築と活用 / t5-news-summarization
upura
0
37
Web からのデータ収集と探究事例の紹介 / no94_jsai_seminar
upura
0
290
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
100
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
310
Other Decks in Technology
See All in Technology
宇宙パトロール ルル子から考える LT設計のコツ
masakiokuda
2
110
Amplifyとゼロからはじめた AIコーディング 成果と展望
mkdev10
1
310
CSS、JSをHTMLテンプレートにまとめるフロントエンド戦略
d120145
0
110
Snowflake Intelligenceで実現できるノーコードAI活用
takumimukaiyama
1
260
工具人的一生: 開發很多 AI 工具讓我 慵懶過一生
line_developers_tw
PRO
0
240
AWS全冠したので振りかえってみる
tajimon
0
150
Copilot Agentを普段使いしてわかった、バックエンド開発で使えるTips
ykagano
1
1.3k
キャディでのApache Iceberg, Trino採用事例 -Apache Iceberg and Trino Usecase in CADDi--
caddi_eng
0
150
「規約、知識、オペレーション」から考える中規模以上の開発組織のCursorルールの 考え方・育て方 / Cursor Rules for Coding Styles, Domain Knowledges and Operations
yuitosato
6
1.9k
「どこにある?」の解決。生成AI(RAG)で効率化するガバメントクラウド運用
toru_kubota
2
450
Long journey of Continuous Delivery at Mercari
hisaharu
1
220
「伝える」を加速させるCursor術
naomix
0
640
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.3k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
228
22k
Building Applications with DynamoDB
mza
95
6.4k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.5k
Code Review Best Practice
trishagee
68
18k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
123
52k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
How to Think Like a Performance Engineer
csswizardry
24
1.7k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Six Lessons from altMBA
skipperchong
28
3.8k
Transcript
R⾔語で「⾔語処理100本 ノック 2020」 u++ (@upura0) 第85回R勉強会@東京(#TokyoR) 2020年5⽉23⽇ 1
概要 4⽉に公開された「⾔語処理100本ノック 2020」の紹介 . 2015年からの5年ぶりの改訂の変更点は? . R⾔語で解いてみる $ whoamai Name:
u++ Job: Data Scientist Interest: Kaggle, NLP https://github.com/upura/nlp100v2020 2
⾔語処理100本ノック 東北⼤の乾・鈴⽊研が公開している⾔語処理研究の⼊⾨者向け教材 https://nlp100.github.io/ja/ 3
お品書き 第1章: 準備運動 第2章: UNIXコマンド 第3章: 正規表現 第4章: 形態素解析 第5章:
係り受け解析 第6章: 機械学習 第7章: 単語ベクトル 第8章: ニューラルネット 第9章: RNN,CNN 第10章: 機械翻訳 4
改訂の変更点 深層ニューラルネットワークに関する問題を追加 多⾔語対応 英語版の公開(39番まで翻訳完了) 旧第6章(英語テキストの処理)を英語版に移動 https://nlp100.github.io/ja/about.html 5
内容の⽐較 章 2020年版 2015年版との差異 1 準備運動 - 2 UNIXコマンド -
3 正規表現 - 4 形態素解析 - 5 係り受け解析 - 6
章 2020年版 2015年版との差異 6 機械学習 第8章から移動 7 単語ベクトル 第9, 10章から移動
8 ニューラルネット 9 RNN,CNN 10 機械翻訳 https://qiita.com/hi-asano/items/3c17943ce06f9999ec6f 7
所感 2018年に「BERT」が登場するなど、近年の⾔語処理を語る 上で⽋かせない深層ニューラルネットワークの問題を新設 ⼀⽅でニューラルネットの実装や計算量の都合で、R⾔語だと 厳しそうな場⾯も・・・ 8
R⾔語で解いてみる https://nlp100.github.io/ja/ch01.html 9
おわりに 4⽉に公開された「⾔語処理100本ノック 2020」の紹介 . 2015年からの5年ぶりの改訂の変更点は? . R⾔語で解いてみる https://www.kaggle.com/sishihara/nlp100-rlang-sample 10