Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
絵文字文生成するやつ
Search
mkan0141
March 22, 2018
Science
0
150
絵文字文生成するやつ
絵文字文を生成します
mkan0141
March 22, 2018
Tweet
Share
More Decks by mkan0141
See All by mkan0141
社会性フィルター付き愚痴投稿サイト
mkan0141
1
880
Other Decks in Science
See All in Science
HAS Dark Site Orientation
astronomyhouston
0
5k
LCG20
lcolladotor
0
230
20240127_OpenRadiossエアバッグ解析
kamakiri1225
0
160
B-Cubed: Leveraging analysis-ready biodiversity datasets and cloud computing for timely and actionable biodiversity monitoring
peterdesmet
0
170
SIGDIAL論文読み会: PGTask: Introducing the Task of Profile Generation from Dialogues
kaiyo3
0
110
How we developed a data exchange format: Lessons learned from Camtrap DP
peterdesmet
1
150
WeMeet Group - 採用資料
wemeet
0
260
「国と音楽」 ~spotifyrを用いて~ #muana
bob3bob3
2
350
Demucsを用いた音源分離
508shuto
0
210
汎用原子シミュレータMatlantis のご紹介
matlantis
0
170
最新のAI技術を使った材料シミュレーションで材料研究現場に変革を
matlantis
0
520
Direct Preference Optimization
zchenry
0
170
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
266
26k
Testing 201, or: Great Expectations
jmmastey
30
6.4k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
323
20k
The Language of Interfaces
destraynor
151
23k
Statistics for Hackers
jakevdp
790
220k
Fireside Chat
paigeccino
22
2.7k
Teambox: Starting and Learning
jrom
128
8.4k
The World Runs on Bad Software
bkeepers
PRO
61
6.7k
Six Lessons from altMBA
skipperchong
22
3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.1k
The Illustrated Children's Guide to Kubernetes
chrisshort
32
47k
Why You Should Never Use an ORM
jnunemaker
PRO
51
8.7k
Transcript
絵文字文生成するやつ
自己紹介 l名前 おみかん lIS科? 2回生 l所属 HxS(幽霊部員気味) , 競技プログラミング(頻繁に現れる) l趣味
競技プログラミング,とかwebアプリ作ったり l最近 React + electron でtwitterClient作ってる Streaming API 廃止でキレた lTwitter みかん@mkan_0141
絵文字文 #とは
ちなみに… 訳 男性よりも女友達と好きな食べ物 を食べる方が大事という意味。失 恋した人を元気づける女子会の 誘い文句として使われる。らしい (参考http://front- row.jp/_ct/17128823) 男よりポテト
ツールの説明 l名前はto_emoji (仮) (C++のto_string()っぽくしました) lコンソールアプリ l日本語文を投げる → それっぽい絵文字文が帰って来る lそんだけ 例:
聞こえません! à "
DEMO
使ったもの lMeCab … 形態素解析ライブラリ( 品詞分解 ) lword2vec … 単語をベクトル表現させるもの。 gensimのライブラリを使った
モデルはwikiのデータを使った 今回は単語と単語の類似度を計算するのに使用 ( word2vec. Word2Vec.model.wv.similarity(A, B)
仕組み 1. 入力した文字列を形態素解析する 2. その中から”名詞”, “形容詞”, “動詞”にあたるものを抽出 3. 抽出した単語を絵文字と意味の一対一表を使って単語と絵文字 の類似度を計算。類似度が一番高いものを出力
おなか すいた : 0.89 :0.32 :0.21 : 0.45
改善点 入力文字を形態素解析すると少し厄介 Ex) 必要ない -> 必要(名詞) ない(形容詞) -> + 今回はwikiだけでモデルを作ったけど、別の文章を取り入れても良さそう?
圧倒的知識不足
おしまい リポジトリに星をください https://github.com/mkan0141/toEmoji