Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
形態素列パターンマッチャーMIURAをつくりました @DSIRNLP#6
Search
Yuya Unno
October 11, 2014
Technology
0
14
形態素列パターンマッチャーMIURAをつくりました @DSIRNLP#6
Yuya Unno
October 11, 2014
Tweet
Share
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
13
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
34
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
25
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
7
進化するChainer @JSAI2017
unnonouno
0
12
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
5
深層学習フレームワーク Chainerとその進化
unnonouno
0
13
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
21
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
10
Other Decks in Technology
See All in Technology
ゼロから創る横断SREチーム 挑戦と進化の軌跡
rvirus0817
2
270
大幅アップデートされたRagas v0.2をキャッチアップ
os1ma
2
530
.NET 9 のパフォーマンス改善
nenonaninu
0
830
AWS re:Invent 2024 ふりかえり
kongmingstrap
0
130
組織に自動テストを書く文化を根付かせる戦略(2024冬版) / Building Automated Test Culture 2024 Winter Edition
twada
PRO
13
3.6k
日本版とグローバル版のモバイルアプリ統合の開発の裏側と今後の展望
miichan
1
130
10個のフィルタをAXI4-Streamでつなげてみた
marsee101
0
160
watsonx.ai Dojo #5 ファインチューニングとInstructLAB
oniak3ibm
PRO
0
160
どちらを使う?GitHub or Azure DevOps Ver. 24H2
kkamegawa
0
710
第3回Snowflake女子会_LT登壇資料(合成データ)_Taro_CCCMK
tarotaro0129
0
190
podman_update_2024-12
orimanabu
1
270
多領域インシデントマネジメントへの挑戦:ハードウェアとソフトウェアの融合が生む課題/Challenge to multidisciplinary incident management: Issues created by the fusion of hardware and software
bitkey
PRO
2
100
Featured
See All Featured
The Invisible Side of Design
smashingmag
298
50k
Producing Creativity
orderedlist
PRO
341
39k
Embracing the Ebb and Flow
colly
84
4.5k
A designer walks into a library…
pauljervisheath
204
24k
Why Our Code Smells
bkeepers
PRO
335
57k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.4k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
29
2k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7k
Imperfection Machines: The Place of Print at Facebook
scottboms
266
13k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Transcript
³¨ÁÅPI ZSKJU MIURA:%7/! Preferred Infrastructure qÊÍ @unnonouno 2014/10/11
@DSIRNLP#6
aÆϱ qÊÍ (@unnonouno) ! Preferred Infrastructure ! ¬£y(~Ð|½37/ !
É£y1#4$(37/ ! NLP¦c,\,fu_*)7/!
grep | sort | uniq 85+ ! “text”,o,]'µÅ:H M&A>ZM
cat text | grep -o [0-9]+ | sort | uniq –c
grep"(9') ! »¬69) ! Ò'Î70)
MIURA:/4
MIURA)6)8 ! “text”,o,]'ÒÅ:H M&A>ZM cat text | miura –o
“<pos=Ò>*” | sort | uniq –c
;)j1 cat text | miura –o “<pos=³Ò><surface=' >” |
sort | uniq –c
MIURA(- ! ³¨ÁÅ*h8 ¿}SKJU ! ºrn§¥¨@ MSMZ*58wÀ ! B?XPI Z¬ !
9b*'v¾9!NLP¦c,\EZR F>T'vd!
MIURA¼PI Z E CZG,x»-³¨Á ! . ! ,³¨Á*SKJ ! <pos=x>
! Òx,³¨Á*SKJ ! <surface=x> ! }x,³¨Á*SKJ ! X* ! X,1,Ä7© ! X|Y ! XY*SKJ
¿¬(§@ MSMZ “<pos=Ò>*<pos=²Ò>” ε ε pos= pos=
Repeat(Cond(pos=Ò))::Cond(pos=²Ò) s,wÀ-,¥¨,/ /&/ !'#%#& $"'&
ºrn§@ MSMZ (1/3) ÃÑ - Ó ' 8 ε
ε pos= pos= µÅ, e ¥¨, e
ºrn§@ MSMZ (2/3) ÃÑ - Ó ' 8 ε
ε pos= pos=
ºrn§@ MSMZ (3/3) ÃÑ - Ó ' 8 ε
ε pos= pos= k*Ì°!6 D Y
® ! µÅ, e(¥¨, e,` ¶ ),'¤m®- O(nm) ! Ô-¢O
N,^),'zpË!, jm® O(nmd) n: µÅ,_ m: ¥¨, d: ^ s,wÀ-¸expjm 7SG
'[pypi*¹´5(!6 (((
lª$! (^o^) https://pypi.python.org/pypi/miura
{¯ 3.lª$! l¡9.2; MIRA(
Miura6Mira
rep*/!
³¨ÁÅPI ZSKJU MREP:%7/! Preferred Infrastructure qÊÍ @unnonouno
=ZGM Yit mecab-python3:$&8,'mecab 0.996 «0,L<GMXQV EWZ"(H G6g98 7 pip
install mrep
·PKJÈ
ÂÇ7(/! ※ wikipedia