Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
形態素列パターンマッチャーMIURAをつくりました @DSIRNLP#6
Search
Yuya Unno
October 11, 2014
Technology
21
0
Share
形態素列パターンマッチャーMIURAをつくりました @DSIRNLP#6
Yuya Unno
October 11, 2014
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
26
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
47
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
46
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
16
進化するChainer @JSAI2017
unnonouno
0
22
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
24
深層学習フレームワーク Chainerとその進化
unnonouno
0
23
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
36
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
16
Other Decks in Technology
See All in Technology
そのSLO 99.9%、本当に必要ですか? 〜優先度付きSLOによる責任共有の設計思想〜 / Is that 99.9% SLO really necessary? Design philosophy of shared responsibility through prioritized SLOs
vtryo
0
500
新卒エンジニア研修、ハンズオンの設計における課題と実践知/ #tachikawaany
nishiuma
2
140
ハーネスエンジニアリング入門
hatyibei
0
120
エンタープライズの厳格な制約を開発者に意識させない:クラウドネイティブ開発基盤設計/cloudnative-kaigi-golden-path
mhrtech
0
380
クラウドネイティブ DB はいかにして制約を 克服したか? 〜進化歴史から紐解く、スケーラブルアーキテクチャ設計指針〜
hacomono
PRO
6
850
Forget technical debt
ufried
0
180
サンプリングは「作る」のか「使う」のか? 分散トレースのコストと運用を両立する実践的戦略 / Why you need the tail sampling and why you don't want it
ymotongpoo
4
160
SREの仕事は「壊さないこと」ではなくなった 〜自律化していくシステムに、責任と判断を与えるという価値〜 / 20260515 Naoki Shimada
shift_evolve
PRO
1
110
SLI/SLO、「完全に理解した」から「チョットデキル」へ
maruloop
2
180
ServiceによるKubernetes通信制御ーClusterIPを例に
miku01
1
160
Purview Endpoint DLP 動かしてみた
kozakigh
0
250
エージェント時代の UIとAPI、CLI戦略
coincheck_recruit
0
160
Featured
See All Featured
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
130
Docker and Python
trallard
47
3.8k
How to build a perfect <img>
jonoalderson
1
5.5k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
150
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.6k
Mobile First: as difficult as doing things right
swwweet
225
10k
Exploring anti-patterns in Rails
aemeredith
3
350
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.2k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
55k
Transcript
³¨ÁÅPI ZSKJU MIURA:%7/! Preferred Infrastructure qÊÍ @unnonouno 2014/10/11
@DSIRNLP#6
aÆÏ± qÊÍ (@unnonouno) ! Preferred Infrastructure ! ¬£y(~Ð|½37/ !
É£y1#4$(37/ ! NLP¦c,\,fu_*)7/!
grep | sort | uniq 85+ ! “text”,o,]'µÅ:H M&A>ZM
cat text | grep -o [0-9]+ | sort | uniq –c
grep"(9') ! »¬69) ! Ò'Î70)
MIURA:/4
MIURA)6)8 ! “text”,o,]'ÒÅ:H M&A>ZM cat text | miura –o
“<pos=Ò>*” | sort | uniq –c
;)j1 cat text | miura –o “<pos=³Ò><surface=' >” |
sort | uniq –c
MIURA(- ! ³¨ÁÅ*h8 ¿}SKJU ! ºrn§¥¨@ MSMZ*58wÀ ! B?XPI Z¬ !
9b*'v¾9!NLP¦c,\EZR F>T'vd!
MIURA¼PI Z E CZG,x»-³¨Á ! . ! ,³¨Á*SKJ ! <pos=x>
! Òx,³¨Á*SKJ ! <surface=x> ! }x,³¨Á*SKJ ! X* ! X,1,Ä7© ! X|Y ! XY*SKJ
¿¬(§@ MSMZ “<pos=Ò>*<pos=²Ò>” ε ε pos= pos=
Repeat(Cond(pos=Ò))::Cond(pos=²Ò) s,wÀ-,¥¨,/ /&/ !'#%#& $"'&
ºrn§@ MSMZ (1/3) ÃÑ - Ó ' 8 ε
ε pos= pos= µÅ, e ¥¨, e
ºrn§@ MSMZ (2/3) ÃÑ - Ó ' 8 ε
ε pos= pos=
ºrn§@ MSMZ (3/3) ÃÑ - Ó ' 8 ε
ε pos= pos= k*̰!6 D Y
® ! µÅ, e(¥¨, e,` ¶ ),'¤m®- O(nm) ! Ô-¢O
N,^),'zpË!, jm® O(nmd) n: µÅ,_ m: ¥¨, d: ^ s,wÀ-¸expjm 7SG
'[pypi*¹´5(!6 (((
lª$! (^o^) https://pypi.python.org/pypi/miura
{¯ 3.lª$! l¡9.2; MIRA(
Miura6Mira
rep*/!
³¨ÁÅPI ZSKJU MREP:%7/! Preferred Infrastructure qÊÍ @unnonouno
=ZGM Yit mecab-python3:$&8,'mecab 0.996 «0,L<GMXQV EWZ"(H G6g98 7 pip
install mrep
·PKJÈ
ÂÇ7(/! ※ wikipedia