Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
R言語で「言語処理100本ノック 2020」/ NLP100 Rlang
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Shotaro Ishihara
May 17, 2020
Technology
2.4k
0
Share
R言語で「言語処理100本ノック 2020」/ NLP100 Rlang
第85回R勉強会@東京(#TokyoR)でのLT資料
https://tokyor.connpass.com/event/176318/
Shotaro Ishihara
May 17, 2020
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
[ACL 2026 Demo] Fast-MIA: Efficient and Scalable Membership Inference for LLMs
upura
0
1
Fast-MIA: Efficient and Scalable Membership Inference for LLMs
upura
0
1
JAPAN AI CUP Prediction Tutorial
upura
2
1k
情報技術の社会実装に向けた応用と課題:ニュースメディアの事例から / appmech-jsce 2025
upura
0
360
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
630
Quantifying Memorization in Continual Pre-training with Japanese General or Industry-Specific Corpora
upura
1
100
JOAI2025講評 / joai2025-review
upura
0
1.6k
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
240
JSAI2025 企画セッション「人工知能とコンペティション」/ jsai2025-competition
upura
0
120
Other Decks in Technology
See All in Technology
自動テストだけで リリース判断できるチームへ - 鍵はテストの量ではなくリリース判断基準の再設計にあった / Redesigning Release Criteria for Lightweight Releases
ewa
7
3.2k
もっとコンテンツをよく構造化して理解したいので、LLM 時代こそ Taxonomy の設計品質に目を向けたい〜!
morinota
0
170
Google Cloud Next '26 の裏でこっそりリリースされたCloud Number Registry & Cloud Hub コスト分析 を試してみた
hikaru1001
0
150
[Scram Fest Niigata2026]Quality as Code〜AIにQAの思考を再現させる試み〜
masamiyajiri
1
200
Oracle Exadata Database Service on Cloud@Customer X11M (ExaDB-C@C) サービス概要
oracle4engineer
PRO
2
7.9k
「誰一人取り残されない」 AIエージェント時代のプロダクト設計思想 Product Management Summit 2026
mizushimac
1
2.8k
ブラウザの投機的読み込みと投機ルールAPIを理解し、Webサービスのパフォーマンスを最適化する
shuta13
3
270
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
2.3k
20260428_Product Management Summit_tadokoroyoshiro
tadokoro_yoshiro
15
18k
サービスの信頼性を高めるため、形骸化した「プロダクションミーティング」を立て直すまでの取り組み
stefafafan
1
230
アクセシビリティはすべての人のもの
tomokusaba
0
250
EMから幅を広げるために最近挑戦していること / Recent challenges I'm undertaking to expand my horizons beyond EM
hiro_torii
1
180
Featured
See All Featured
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
140
How Software Deployment tools have changed in the past 20 years
geshan
0
33k
It's Worth the Effort
3n
188
29k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.7k
What's in a price? How to price your products and services
michaelherold
247
13k
RailsConf 2023
tenderlove
30
1.4k
Prompt Engineering for Job Search
mfonobong
0
290
Chasing Engaging Ingredients in Design
codingconduct
0
180
Documentation Writing (for coders)
carmenintech
77
5.3k
From π to Pie charts
rasagy
0
180
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
390
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Transcript
R⾔語で「⾔語処理100本 ノック 2020」 u++ (@upura0) 第85回R勉強会@東京(#TokyoR) 2020年5⽉23⽇ 1
概要 4⽉に公開された「⾔語処理100本ノック 2020」の紹介 . 2015年からの5年ぶりの改訂の変更点は? . R⾔語で解いてみる $ whoamai Name:
u++ Job: Data Scientist Interest: Kaggle, NLP https://github.com/upura/nlp100v2020 2
⾔語処理100本ノック 東北⼤の乾・鈴⽊研が公開している⾔語処理研究の⼊⾨者向け教材 https://nlp100.github.io/ja/ 3
お品書き 第1章: 準備運動 第2章: UNIXコマンド 第3章: 正規表現 第4章: 形態素解析 第5章:
係り受け解析 第6章: 機械学習 第7章: 単語ベクトル 第8章: ニューラルネット 第9章: RNN,CNN 第10章: 機械翻訳 4
改訂の変更点 深層ニューラルネットワークに関する問題を追加 多⾔語対応 英語版の公開(39番まで翻訳完了) 旧第6章(英語テキストの処理)を英語版に移動 https://nlp100.github.io/ja/about.html 5
内容の⽐較 章 2020年版 2015年版との差異 1 準備運動 - 2 UNIXコマンド -
3 正規表現 - 4 形態素解析 - 5 係り受け解析 - 6
章 2020年版 2015年版との差異 6 機械学習 第8章から移動 7 単語ベクトル 第9, 10章から移動
8 ニューラルネット 9 RNN,CNN 10 機械翻訳 https://qiita.com/hi-asano/items/3c17943ce06f9999ec6f 7
所感 2018年に「BERT」が登場するなど、近年の⾔語処理を語る 上で⽋かせない深層ニューラルネットワークの問題を新設 ⼀⽅でニューラルネットの実装や計算量の都合で、R⾔語だと 厳しそうな場⾯も・・・ 8
R⾔語で解いてみる https://nlp100.github.io/ja/ch01.html 9
おわりに 4⽉に公開された「⾔語処理100本ノック 2020」の紹介 . 2015年からの5年ぶりの改訂の変更点は? . R⾔語で解いてみる https://www.kaggle.com/sishihara/nlp100-rlang-sample 10