Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
word prediction
Search
tetsuroito
June 24, 2017
Technology
0
790
word prediction
第62回Tokyo.RのLT資料です
tetsuroito
June 24, 2017
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.8k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
810
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
600
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.6k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.7k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
120
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.4k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.9k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.2k
Other Decks in Technology
See All in Technology
組織貢献をするフリーランスエンジニアという生き方
n_takehata
2
1.3k
ハッキングの世界に迫る~攻撃者の思考で考えるセキュリティ~
nomizone
13
5.2k
目の前の仕事と向き合うことで成長できる - 仕事とスキルを広げる / Every little bit counts
soudai
25
7.2k
PHPカンファレンス名古屋-テックリードの経験から学んだ設計の教訓
hayatokudou
2
380
RSNA2024振り返り
nanachi
0
590
次世代KYC活動報告 / 20250219-BizDay17-KYC-nextgen
oidfj
0
260
N=1から解き明かすAWS ソリューションアーキテクトの魅力
kiiwami
0
130
プロセス改善による品質向上事例
tomasagi
2
2.6k
OpenID Connect for Identity Assurance の概要と翻訳版のご紹介 / 20250219-BizDay17-OIDC4IDA-Intro
oidfj
0
280
速くて安いWebサイトを作る
nishiharatsubasa
11
13k
急成長する企業で作った、エンジニアが輝ける制度/ 20250214 Rinto Ikenoue
shift_evolve
3
1.3k
Culture Deck
optfit
0
430
Featured
See All Featured
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
630
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
GitHub's CSS Performance
jonrohan
1030
460k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
Adopting Sorbet at Scale
ufuk
74
9.2k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
GraphQLとの向き合い方2022年版
quramy
44
13k
The Language of Interfaces
destraynor
156
24k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
114
50k
Automating Front-end Workflow
addyosmani
1368
200k
Transcript
Tokyo.R ver.62 LT ʮWord Predictionʯ 2017/06/24(sat) @ࣚཹ
ࣗݾհ ໊લɿҏ౻ ప(@tetsuroito) ࣄɿFinTechܥ झຯɿञɺαοΧʔ؍ઓɺεΩʔ ݴޠɿSQLRݴޠɻ࠷ۙPythonͬͯΔ ࠷ۙੳͱ͔͋Μ·Γ͍ͯ͠ͳ͍
એɿ࿈ࡌͬͯ·͢ ιʔγϟϧ֦ࢄͷఆྔσʔλ͕ࢲͷϞνϕͰ͢
ࠓͷLTͷ͖͔͚ͬ ;ͱ31VCTͷΤϯτϦΛݟ͍ͯͨΒɺ ԿΒ໘നͦ͏ͳͷΛൃݟͨ͠ͷͰɺ ࠓ͜ΕͷͰ͢ IUUQSQVCTDPN.BMPSFBO
എܠͱϞνϕʔγϣϯ ɾܞଳΩʔϘʔυϨΠΞτʹখ͍͞ ɾॖͨ͠ϫʔυΛଧͪࠐΉ͍͔ͭ͘ͷख๏͕͋Δ T9 (Text on 9keys):ΨϥέʔϘλϯΈ͍ͨͷ Sliding:εϚϑΥͷΩʔϘʔυ ༧ଌม ͜ͷ1+ೖྗ͞ΕͨϑϨʔζʹ࠷͋Γͦ͏ͳޠΛ
༧ଌͯ͠ఏࣔ͢Δͱ͍͏ͷ
ߏ Capstone Dataset RͰ࣮ݱ ख๏ɿTMɺQuantedaɺtext2vec DBɿSqlite using RSQlite εϐʔυͱγϯϓϧ͞Ͱ্هͷબఆ
σʔλϞσϧ ετοϓϫʔυͳ͠ N-GramΛར༻Ͱ(2-Gram͔Β7-Gram) ༧ଌม
N-Gram n-1ޠΛจ຺ͱͯ࣍͠ͷޠΛ༧ଌ จࣈn-gram ୯ޠn-gram class n-gramͳͲ ࣗવݴޠॲཧʹ͓͚ΔҰൠతͳݴޠϞσϧͰ͢
݁ՌShiny Appʹ IUUQTNBMPSFBOTIJOZBQQTJP8PSE1SFEJDUJPO
݁ ɾ՝ ɹ5.ύοέʔδͷେ͖͍σʔληοτͷύϑΥʔϚϯε ɹΠϯϑϧΤϯβʹ͔͔ͬͯ࣌ؒͱΒΕͪΌͬͨ ɾֶͼ ɹXPSLJUFSBUJWF ɹͬͱίʔυσʔλখ͘͞Ͱ͖Δ͔ ɾࠓޙͷൃలʹΉ͚ͯ ɹҧ͏σʔλͰࢼ͍ͨ͠ ɹ4LJQ(SBNΛ͏
ɹ,OFTFS/FZ,BU[`TCBDLP⒎ͰεϜʔδϯά
͝੩ௌ͋Γ͕ͱ͏ ͍͟͝·ͨ͠ʂ