Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
バカが取ったバイキングの皿を持ってきたよ!!
Hayato Tsukagoshi
June 01, 2020
Programming
0
1.1k
バカが取ったバイキングの皿を持ってきたよ!!
This slide describe Twitter bot 'ujimaru', which says words like uzimaru.
Hayato Tsukagoshi
June 01, 2020
Tweet
Share
More Decks by Hayato Tsukagoshi
See All by Hayato Tsukagoshi
[輪講資料] Language-agnostic BERT Sentence Embedding
hpprc
1
800
[輪講資料] SimCSE: Simple Contrastive Learning of Sentence Embeddings
hpprc
5
1.5k
p1ass-lt-hpp
hpprc
0
850
Gatsby.js布教計画
hpprc
1
420
Other Decks in Programming
See All in Programming
Improving Developer Experience Through Tools and Techniques 2022
krzysztofzablocki
0
170
Terraform Plan/Apply結果の自動通知
ymmy02
0
270
IE Graduation (IE の功績を讃える)
jxck
20
12k
はじめてのプルリク - BLEA 編
watany
0
140
Swift6のprotocol
omochi
3
310
1時間半で克服するJavaScriptの非同期処理/async_javascript_kokufuku
marchin1989
2
590
What's new in Jetpack / I/O Extended Japan 2022
star_zero
1
170
Power Automateドリブンのチームマネジメント
hanaseleb
0
170
JetPackComposeは宣言型プログラミングパラダイムって実はよくわかってないんですが、別に使ってもいいんですよね、
conigashima
0
160
Amazon ECSのネットワーク関連コストの話
msato
0
610
Dagger + Anvil: Learning to Love Dependency Injection
vrallev
2
230
実践エクストリームプログラミング / Extreme Programming in Practice
enk
0
170
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
396
62k
What the flash - Photography Introduction
edds
61
10k
Product Roadmaps are Hard
iamctodd
34
6.5k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
10
3.3k
Learning to Love Humans: Emotional Interface Design
aarron
261
37k
WebSockets: Embracing the real-time Web
robhawkes
57
5.1k
Art, The Web, and Tiny UX
lynnandtonic
280
17k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
181
15k
Bootstrapping a Software Product
garrettdimon
296
110k
Rails Girls Zürich Keynote
gr2m
86
12k
Designing for Performance
lara
597
63k
What's in a price? How to price your products and services
michaelherold
229
9.4k
Transcript
うじまる生誕LT会 バカが取ったバイキングの皿 を持って来たよ!! @hpp_ricecake
うじまる生誕LT会 hpp Twitter : @hpp_ricecake GitHub : hppRC
うじまる生誕LT会 作ったもの
うじまる生誕LT会 うぢまるくん
うじまる生誕LT会
うじまる生誕LT会
うじまる生誕LT会 実装内容
うじまる生誕LT会 - Ujimaru Reformer (不採用) - Ujimaru Markov Model
- Ujimaru Twitter Crawler - Ujimaru Twitter Client - Ujimaru API
うじまる生誕LT会 Ujimaru Reformer
うじまる生誕LT会 Ujimaru Reformer Reformer : NLP分野でSOTAな結果を出しまくったTransformerの高効率版 - うじまるくんのツイートを収集、8000文ほどを元データに(ごめん)
- Google Colaboratory で6時間ほど訓練 - 著者実装を参考にTPU(はやいやつ)で - 訓練したモデルから文生成をする(予定だった) - 生成結果は次のページ
うじまる生誕LT会 Ujimaru Reformer
うじまる生誕LT会 Ujimaru Reformer 反省点 - データが少なすぎる(最低でも100,000文くらいは欲しい...) 解決策 -
うじまるくんが1日4000ツイートくらいする - 日本語Wikiのデータを混ぜる(全然関係ないモデルに...) - データ数が少なくても大丈夫な言語モデルに変更する
うじまる生誕LT会 Ujimaru Markov Model
うじまる生誕LT会 Ujimaru Markov Model マルコフ連鎖 : 以前に出現した系列を元に次の出力を確率的に生成する -
うじまるくんの以前のツイートを元にモデルを作成 - ライブラリとして使えるように、JSONでモデルを出力 - 他の人のツイートも同じく収集して似た傾向の語彙を増強 - PyPIに登録したので`pip install ujimaru-markov-model`して `ujimaru`をするとうじまるくんが喋ります
うじまる生誕LT会 Ujimaru Markov Model
うじまる生誕LT会 Ujimaru Twitter Crawler
うじまる生誕LT会 Ujimaru Twitter Crawler 実装: GO - データ収集に利用 -
anacondaを使用(超便利) - Standard Search APIじゃ足りなかったので Premium Search API (無料枠)も使用 - anacondaにPremium APIを触るメソッドが生えてなかったのでforkして生や した
うじまる生誕LT会 Ujimaru Twitter Client
うじまる生誕LT会 Ujimaru Twitter Client 実装: Rust - ツイートの定期投稿に利用
- ツイートするテキストはAPIから取得 - Twitter API を叩くいい感じのライブラリがなかったので自作↓ - Kuonという名前のOSSとして公開しました(めっちゃWIP)
うじまる生誕LT会 Ujimaru API
うじまる生誕LT会 Ujimaru API 実装: Python (flask) - Cloud
Run でデプロイ (https://ujimaru-api-l3qfihnisq-an.a.run.app/tweet) - アクセスすると生成したテキストを返す - Docker imageをポイするだけなので超簡単
うじまる生誕LT会 Ujimaru API まとめ - ニューラルなモデルを使うときはデータ数に気を付ける - ソースコード
: https://github.com/hppRC/ujimaru - LTのスライドは内容を絞ろう
うじまる生誕LT会