シンデレラガールズ台詞判定の開発・運用・反響について

by shuukei.imas_cg

Slide 1

Slide 1 text

シンデレラガールズ台詞判定の開発・運用・反響についてたくみP 2017/05/17 http://www.shuukei.info/

Slide 2

Slide 2 text

自己紹介  たくみP  担当アイドル: 喜多日菜子  Twitter: @shuukei_imas_cg  もともとはモバマス-Pixiv集計所のための更新状況通知用アカウントだった  @[email protected]  運営しているサイト・サービス http://www.shuukei.info/  モバマス-Pixiv集計所  シンデレラガールズ台詞判定  ミリオンライブ！台詞判定  喜多日菜子LINE BOT 2017/05/17 2

Slide 3

Slide 3 text

シンデレラガールズ台詞判定とは  機能1「アイドル判定」  任意のテキストを入力すると「どのアイドルが発した台詞らしいか」をスコア付きで表示する  機能2「形態素スコア」  テキスト中、どの形態素が「アイドルらしさ」に寄与しているか、重みを表示する  主な使用OSS  Jubatus(機械学習フレームワーク)  MeCab(形態素解析器)  mecab-ipadic-Neologd(単語区切り用辞書) 2017/05/17 3

Slide 4

Slide 4 text

技術的解説は記事を参照  Qiitaに「ノンプログラミングで機械学習サービスが作りたい! テキスト分類編」以下3編で解説しました  http://qiita.com/shuukei-imas-cg/items/ea501e62970b309ceea4 2017/05/17 4

Slide 5

Slide 5 text

開発の動機1  もともとアイマスハッカソン2016(2016/12/17)の開発研究テーマだった  「シンデレラガールズの台詞のみから「誰の台詞か」機械学習で判定する」  Jubatusを用いた台詞判定のコア機能はこのときに実現していた  ハッカソンのテーマである「アイドルを愛でる、アイマスにContributeする」を(自分なりに)真正面からマジに実行しようとした  二次創作のインフラを作りたかった 2017/05/17 5 https://speakerdeck.com/shuukeiimascg/sindereragaruzufalsetai- ci-falsemikara-shui-falsetai-ci-ka-ji-jie-xue-xi-depan-ding-suru

Slide 6

Slide 6 text

開発の動機2  「アイドル判定」機能だけではサービスとして成立しないと考えていた(すぐ飽きられる)  「どこを変えればより特定のアイドルらしくなるか」を示す機能があれば実用になるのではないか? →形態素スコア機能  それが実現する見込みが付いた  参考にしたもの: 「かまってちゃん小町」 in Jubatus ハッカソン with 読売新聞 #2  Jubatusの学習後の重みを取り出して「らしさ」として使うアイデア 2017/05/17 6

Slide 7

Slide 7 text

形態素スコア機能について  Jubatusモデルファイルから重みを取り出す  [アイドル名: [形態素: 重み]] の形に転置する { “アナスタシア”: { "あげる-動詞": -0.0977340885989, "あたし-名詞": -0.400298029184, "あたたかい-形容詞": 0.0333652123809, "あちこち-名詞": -0.145350828767, "あと-名詞": -0.158124983311, "あの-連体詞": -0.29390492117, "あまり-副詞": -0.213139493779, "あら-感動詞": -0.296767287815, "あり-動詞": 0.28585652128, "ありがとう-感動詞": 0.119166985699, "ありません-名詞": 0.246373766782, "ある-動詞": -0.115131826326, "あれ-動詞": -0.244251795935, "あー-フィラー": 0.376662068107, … 転置した「重み」のJSONファイル実行例→

Slide 8

Slide 8 text

開発の動機3  Twitterで需要を聞いてみたところ (フォロワー300 のこのアカウントにしては)反響があった  320RTくらい 2017/05/17 8

Slide 9

Slide 9 text

開発の動機4  来るべき「第6回シンデレラガール総選挙」に向けて喜多日菜子のダイマがしたかった 2017/05/17 9 [ひらひらふわり]喜多日菜子+ …の代わりに「盆踊りをする女性」 ©いらすとや日菜子、かわいいよ!

Slide 10

Slide 10 text

設計・開発開始 10 2017/05/17

Slide 11

Slide 11 text

アーキテクチャの選定1  制約と前提条件  このサービスのために新しくレンタルサーバ/VPSの類を契約したくなかった  そんな金があったらガチャを回すから  ガチな24h/365Dayサービスを提供するわけではない  既存のサイトでAWS S3による静的Webホスティングの経験があった  自宅サーバのリソースに余裕があって回線が安定していた  いい機会なのでWebフロントエンドの技術を勉強したかった 2017/05/17 11

Slide 12

Slide 12 text

アーキテクチャの選定2  JavaScriptによるフロントエンド(いわゆるSPA)を AWS S3に、バックエンドを自宅サーバに配置することに決定  フロントエンドがSPAなら、バックエンドが死んでいても正常にエラーを返せるという期待がある  JSフレームワークの選定: Vue.js  仕様がコンパクトで学習コストが低い  今回は小規模なプロジェクトなのでフルスタックフレームワークは不要  バックエンド: Python標準のWebサーバ  simple_serverで十分(とこのときは思っていた) 2017/05/17 12

Slide 13

Slide 13 text

システム構成 13 Amazon S3 Vue.js + Bootstrap フロントエンド Dospara Core-i7 970 Mem: 24GB HYPER-V Server 2012 R2 VCPU: 2 mem: 6GB • Pythom(Falcon + Gunicorn) • Jubatus • MeCab バックエンド Vue-resourceで HTTP通信

Slide 14

Slide 14 text

開発日程  2016年12月17日  アイマスハッカソンでプロトタイプ作成  2017年2月4日  思い立ってTwitter上で需要をリサーチする → 320RT  2月5日  制作決定、VMインスタンスの整備、バックエンド制作  2月6～9日  フロントエンドの制作  2月9日 18:02  公開 2017/05/17 14

Slide 15

Slide 15 text

開発中の課題1  Webフロントエンドよくわからん問題  Webpack, Gulp(タスクランナー), Vue.js, CORS, CSS フレームワーク, SASS, トランスパイラ…  覚えることが多すぎる  解決策1: とにかくボイラープレートをベースにして、 JSのエコシステムに完全に乗っかってしまう  解決策2: 逆にまったく使わない。Vue.jsだとHTMLに scriptタグ1行書くだけで導入はできる HTML+CSSで書き始めて、部分的にVue.jsを導入する  そもそもJavaScriptよくわからん問題  ES5, ES2015(ES6), ES2016…  Vue.jsのボイラープレートで入るLinterが指摘してくれるので、そのとおりに書くだけ  最初にコストをかけても開発環境を整えるべき 15

Slide 16

Slide 16 text

開発中の課題2  タスクに応じた形態素解析辞書は不可欠  MeCabのユーザ辞書を適切に構築する必要がある  が、単語生起コストを設定するのが難しい  mecab –F オプションで既存形態素のコストを確認しながら登録する  mecab -F"%m,%c¥n"  単語生起コストが適切でないと…  例:名前が他のアイドル名の部分文字列である場合  菊地真の「真」を生起コスト0で登録 → 真鍋いつきが「真」「鍋」「いつき」に分割されてしまう 2017/05/17 16

Slide 17

Slide 17 text

公開してみた 17 2017/05/17

Slide 18

Slide 18 text

公開前の負荷見積もり  観測: 需要リサーチのツイートは320RT, 300Like だった  予想: 2～3日かけて、反応してくれた3～400人が試してくれればいいかな～  さて、いざ実際に公開してみると…  2017/02/09(木) 18:02 以下の内容でツイート 2017/05/17 18

Slide 19

Slide 19 text

18:22(公開20分後) 2017/05/17 19

Slide 20

Slide 20 text

18:26(公開24分後) 2017/05/17 20

Slide 21

Slide 21 text

18:37(公開35分後) 2017/05/17 21

Slide 22

Slide 22 text

一気にリクエストが集中  判定(WebAPI)サーバへのリクエスト  判定結果の表示まで10秒以上かかるか、タイムアウト連発の状態に 2017/05/17 22 時間帯総リクエスト req/sec 18:00 33709 9.36 19:00 44995 12.50 20:00 41215 11.45 21:00 33229 9.23 22:00 23006 6.39 23:00 17409 4.83

Slide 23

Slide 23 text

サーバの負荷状況  しかし、サーバの負荷自体は問題なし  CPU load: 15～20%  メモリ: 特にスワップしてない  I/O: 問題なさそう  ネットワーク: たぶん問題ない  Webサーバ(simple_server)がタイムアウトしてプロセスのkillとforkを繰り返している  設定が適切でないのは明らか  …が、設定方法がよくわからない  このときはWebフレームワークとWSGIサーバの関係もよく解っていなかった 2017/05/17 23

Slide 24

Slide 24 text

対処  案1: フロントエンドの改修  とりあえず、「判定」ボタンをリクエストが返ってくるまで押せないようにDisableする  30分作業してうまくいかないのであきらめた  案2: WebAPIサーバ自体の改修  「Python web API サーバ高速」でググることからはじめる 2017/05/17 24

Slide 25

Slide 25 text

WebAPIサーバの改修  2時間ほどかけて(21:18完了)構成を変更  変更前: webapp2 + simple_server  変更後: Falcon + Gunicorn  一瞬(20～50ms)で表示できるように  事前の負荷テストが大事  事前に負荷を見積もってもそれを超えるアクセスが押し寄せることはある  せめてサーバリソースを適切に使い切ろう  開発用のsimple_serverで本番稼働しようなどという甘い考えを持たないことが大事 2017/05/17 25

Slide 26

Slide 26 text

公開当日のアクセス状況  2/9～10の2日間の状況 2017/05/17 26

Slide 27

Slide 27 text

運用とその後の改修 2017/05/ 17 27

Slide 28

Slide 28 text

運用1  フロントエンド  ビルド  Webpackを使う  npm run devで開発、npm run buildでビルド  SPAのフロントエンドは環境依存性があまりないので特にステージング環境は用意していない  必要だとすればCORSやGoogle Analyticsの部分か  デプロイ  gulp deploy で一発でS3にSyncするよう設定[重要]  サービスイン後にはどうせ何らかの問題が発生して修正が必要になるので、それを素早く行えることが重要  AWSのWeb管理画面からアップロード…みたいなのは結局コスト高につく 2017/05/17 28

Slide 29

Slide 29 text

運用2  バックエンド  PyCharm(Python統合開発環境)のDeploy機能で同期  開発用には別ポートのGunicornとJubatusを立てる  学習データの追加や改修時  Jubatusのモデル更新時の停止時間を短縮する方法  あらかじめ別プロセスでjubaclassfierを起動して学習し、モデルデータをセーブしておく  120,000個の台詞の学習に約10分かかる  Gunicorn終了→Jubatus終了→Jubatusで新モデルをロードして起動→Gunicorn起動  慣れれば5秒くらいで再起動できる 2017/05/17 29

Slide 30

Slide 30 text

その後の改修1  ミリオンライブ！台詞判定対応(2/20)  1つの判定器(同一のjubaclassifierプロセス)に複数の特徴を同居させるテクニックを使用  バックエンドを1本化  ミリデレ混合モードの搭載(4/28)  あらかじめ台詞データを結合しておき、上述のテクニックを使用  1つの判定器プロセスに3つの特徴が入っている状態  「セクシー」や「カフェ」で判定すると面白い結果になるのでおすすめ 2017/05/17 30

Slide 31

Slide 31 text

その後の改修2  判定精度の向上  品詞情報(名詞、動詞、形容詞…)の利用  感動詞の「え」とフィラーの「え」を区別する  0.5%くらい向上  ドメイン固有の形態素解析辞書の使用  あだ名や典型的な呼び方を既存資料をもとに登録  「このみ姉さん」問題も同時に解決  やはり0.5%くらい向上 2017/05/17 31

Slide 32

Slide 32 text

利用者の反響 2017/05/17 32

Slide 33

Slide 33 text

反応1  最初のリリースツイート 2017/05/17 33

Slide 34

Slide 34 text

反応2  よくある使われ方  アイドルがどの言い方を好むかの確認に使われる  「あまり」 VS 「あんまり」  「ロックにいくぜー!」 VS 「ロックにいくぜ!」  2人のアイドルが発現頻度的に両思いか否か  「志保ちゃん」→矢吹可奈  「可奈」→ 北沢志保  完全に意図を汲んだ使われ方も  https://twitter.com/ndmctsr/status/853475003316056064 からの一連のツイート  ミリオンライブドラマシアターの推敲に 2017/05/17 34 ＼かなしほ／

Slide 35

Slide 35 text

反応3  意外な? 使われ方  曲の歌詞をぜんぶぶち込んでくる人がいる  ワンドロのお題探し  適当なタイトルの台詞を入力して判定結果のアイドルで絵を描く  「日常で使える淫夢語録」を片っ端からぶち込む  君だけのBE MY BABYを作ろう！  判定結果上位2人でBMB  自分が言ってほしい台詞を入力して、いずれかのアイドルと判定されることで「システムに承認された」承認欲求が満たされるらしい 2017/05/17 35

Slide 36

Slide 36 text

NEologdにゆいちな※採録1 (※大槻唯・相川千夏のカップリング) 2017/05/17 36

Slide 37

Slide 37 text

NEologdにゆいちな採録2  まだ半信半疑の筆者 2017/05/17 37

Slide 38

Slide 38 text

NEologdにゆいちな採録3  ガチでシンデレラガールズのゆいちなだった 2017/05/17 38

Slide 39

Slide 39 text

アイマス人名が追加(5/13)  アイドル282人中276人正しく解析できる  765AS(13), 876(3), ミリ(37), デレ(183), 315(46)  残る6人は報告中 → 5/15の更新で5人修正  みんなもNEologd使おう 2017/05/17 39

Slide 40

Slide 40 text

まとめ1  低コストで持続的にWebサービスを提供する例を説明した  金額的コスト、心理的コスト  サービスとしてリリースすることの重要さ  技術記事を書くだけでなく実際のシステムとしてリリースすることで、技術者でないPにもリーチする (そして意外な使われ方に関する知見が得られる)  一時的な高負荷への対処  いかに負荷見積もりを行っても偶然バズる可能性はある(そしてあっという間に波が引いていく)。対処方法について一応考えておく 2017/05/17 40

Slide 41

Slide 41 text

まとめ2  スマホからのアクセスは7割  スマートフォンの機種によっても横幅は違うので、実機かエミュレータで確認することが望ましい  機械学習は楽しい  最先端のディープラーニング手法でなくともまだまだできることはある(使いこなすアイデアが追いついてない)感  サービスの横のつながりがほしい  せっかくバックエンドをWebAPIにしたのだから、他サービスから使ってもらう等 2017/05/17 41