Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
形態素列パターンマッチャーMIURAをつくりました @DSIRNLP#6
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Yuya Unno
October 11, 2014
Technology
0
20
形態素列パターンマッチャーMIURAをつくりました @DSIRNLP#6
Yuya Unno
October 11, 2014
Tweet
Share
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
22
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
44
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
45
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
14
進化するChainer @JSAI2017
unnonouno
0
19
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
20
深層学習フレームワーク Chainerとその進化
unnonouno
0
20
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
29
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
15
Other Decks in Technology
See All in Technology
22nd ACRi Webinar - NTT Kawahara-san's slide
nao_sumikawa
0
120
コミュニティが変えるキャリアの地平線:コロナ禍新卒入社のエンジニアがAWSコミュニティで見つけた成長の羅針盤
kentosuzuki
0
130
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.6k
配列に見る bash と zsh の違い
kazzpapa3
3
170
Cosmos World Foundation Model Platform for Physical AI
takmin
0
980
AIエージェントを開発しよう!-AgentCore活用の勘所-
yukiogawa
0
190
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
2
210
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
SchooでVue.js/Nuxtを技術選定している理由
yamanoku
3
210
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.7k
22nd ACRi Webinar - 1Finity Tamura-san's slide
nao_sumikawa
0
110
Agent Skils
dip_tech
PRO
0
140
Featured
See All Featured
Building Adaptive Systems
keathley
44
2.9k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
180
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
The Cost Of JavaScript in 2023
addyosmani
55
9.5k
Music & Morning Musume
bryan
47
7.1k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
72
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
66
Faster Mobile Websites
deanohume
310
31k
GraphQLの誤解/rethinking-graphql
sonatard
74
11k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
120
Transcript
³¨ÁÅPI ZSKJU MIURA:%7/! Preferred Infrastructure qÊÍ @unnonouno 2014/10/11
@DSIRNLP#6
aÆÏ± qÊÍ (@unnonouno) ! Preferred Infrastructure ! ¬£y(~Ð|½37/ !
É£y1#4$(37/ ! NLP¦c,\,fu_*)7/!
grep | sort | uniq 85+ ! “text”,o,]'µÅ:H M&A>ZM
cat text | grep -o [0-9]+ | sort | uniq –c
grep"(9') ! »¬69) ! Ò'Î70)
MIURA:/4
MIURA)6)8 ! “text”,o,]'ÒÅ:H M&A>ZM cat text | miura –o
“<pos=Ò>*” | sort | uniq –c
;)j1 cat text | miura –o “<pos=³Ò><surface=' >” |
sort | uniq –c
MIURA(- ! ³¨ÁÅ*h8 ¿}SKJU ! ºrn§¥¨@ MSMZ*58wÀ ! B?XPI Z¬ !
9b*'v¾9!NLP¦c,\EZR F>T'vd!
MIURA¼PI Z E CZG,x»-³¨Á ! . ! ,³¨Á*SKJ ! <pos=x>
! Òx,³¨Á*SKJ ! <surface=x> ! }x,³¨Á*SKJ ! X* ! X,1,Ä7© ! X|Y ! XY*SKJ
¿¬(§@ MSMZ “<pos=Ò>*<pos=²Ò>” ε ε pos= pos=
Repeat(Cond(pos=Ò))::Cond(pos=²Ò) s,wÀ-,¥¨,/ /&/ !'#%#& $"'&
ºrn§@ MSMZ (1/3) ÃÑ - Ó ' 8 ε
ε pos= pos= µÅ, e ¥¨, e
ºrn§@ MSMZ (2/3) ÃÑ - Ó ' 8 ε
ε pos= pos=
ºrn§@ MSMZ (3/3) ÃÑ - Ó ' 8 ε
ε pos= pos= k*̰!6 D Y
® ! µÅ, e(¥¨, e,` ¶ ),'¤m®- O(nm) ! Ô-¢O
N,^),'zpË!, jm® O(nmd) n: µÅ,_ m: ¥¨, d: ^ s,wÀ-¸expjm 7SG
'[pypi*¹´5(!6 (((
lª$! (^o^) https://pypi.python.org/pypi/miura
{¯ 3.lª$! l¡9.2; MIRA(
Miura6Mira
rep*/!
³¨ÁÅPI ZSKJU MREP:%7/! Preferred Infrastructure qÊÍ @unnonouno
=ZGM Yit mecab-python3:$&8,'mecab 0.996 «0,L<GMXQV EWZ"(H G6g98 7 pip
install mrep
·PKJÈ
ÂÇ7(/! ※ wikipedia