Upgrade to Pro — share decks privately, control downloads, hide ads and more …

全148曲から一番アイカツ!っぽい歌をみんなに薦めたい

kawase
December 17, 2018

 全148曲から一番アイカツ!っぽい歌をみんなに薦めたい

https://adventar.org/calendars/3700
アイカツ! Advent Calendar 2018 18日目です。

社内LTで使用した資料ですが
Skip-Gramモデルによるアイカツ148曲(バージョン違い除く)の分析です。

https://snofra.hatenablog.com/

kawase

December 17, 2018
Tweet

Other Decks in Technology

Transcript

  1. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ アイカツ!とは • バンダイが発売するデータカードダス(DCD)を使用した 日本の女児向けアーケードゲーム •

    上記を原作・原案としたテレビアニメ • 現在は「アイカツフレンズ!」放送中 • 2017年10月で5周年を迎えました!
  2. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ 今回の分析構成 ローカルPC データ可視化 word2vec Skip-Gramモデルを使った

    深層学習 Jenkins Server 歌詞 サイト スクレイピング TSV ファイル TSV ファイル 生データ 加工 データ データ収集 mecab 前処理+形態素解析
  3. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ 今回の分析構成(今回のスコープ) ローカルPC データ可視化 word2vec Skip-Gramモデルを使った

    深層学習 Jenkins Server 歌詞 サイト スクレイピング TSV ファイル TSV ファイル 生データ 加工 データ データ収集 mecab 前処理+形態素解析 今回のスコープ外
  4. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ アイカツ!っぽい歌って何だろう • アイカツ!は女児向けゲーム/アニメ →様々な作詞家が作詞しているが、きっとブランドに合う歌詞を 求められるはず

    • ブランドに合う歌詞 →歌詞からアイカツ!のテーマ性が見える単語が散らばっている のは? アイカツ!の歌詞でよく出てくる単語を確認してみよう
  5. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ 形態素解析で頻出単語を洗い出す • 形態素解析 文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語 の品詞等の情報にもとづき、形態素(Morpheme,

    おおまかにいえば、言語で意味を持つ最小単位)の列に分 割し、それぞれの形態素の品詞等を判別する作業である。(wikipediaより引用) • 「すもももももももものうち」 →「すもも」「も」「もも」「も」「もも」「の」「うち」 品詞別のワードに分割してあげよう
  6. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ 形態素解析で頻出単語を洗い出す • 今回歌詞から取得するのは「名詞」「動詞」「形容詞」 • 歌詞を分かち書きにして、ストップワードを除去。表記ゆれの

    修正をする。 今日が生まれかわるセンセイション 全速力つかまえて! アタマのなか膨らむイメージ カタチにした ら世界でひとり あたらしいわたしになれる 大好きで育てなくちゃ 今日 生まれる かわる センセイション 全速力 つかまえる アタマ なか 膨らむ イメージ カタチ する 世界 ひとり あたらしい わたし なれる 大好き 育てる 今日 生まれる かわる センセイション 全速力 つかまえる アタマ 膨らむ イメージ カタチ 世界 ひとり 新しい 私 大好き 育てる 歌詞の分かち書き ストップワード・表記ゆれ修正
  7. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ 頻出単語トップ10 1位 私 248 2位

    君 191 3位 夢 171 4位 未来 113 5位 心 107 6位 笑顔 101 7位 世界 90 8位 今日 89 9位 光 81 10位 YOU 81 順位 単語 出現回数 • どうやらアイカツ!の歌は「私」から「君」への歌のよう
  8. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ 148曲で頻出単語上一番のアイカツ!曲 •ドラマチックガール • 頻出単語を計30回使用 •

    アイカツおじさん的には ✓星宮いちごのユニットと、次の主人公大空あかりのユニットが一 緒に歌った初のオリジナル曲 ✓ライブでもよく歌われる1曲 これは薦められる1曲!!!!!
  9. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ Word2vecで「アイカツ!」っぽい曲を探す • 形態素解析した歌詞からDeepLearningを使用して 「アイカツ!」のイメージに一番合った曲を探そう →

    「アイカツ!」という単語の類似度をチェックする • Word2vecはSkip-GramモデルとCBOWがあるが、 今回はSkip-Gramモデルを使用 • 今回のモデルは以下観点にて生成 1. ベクトルの次元数は学習に使用する単語が3600語程度だったので、300 2. 3回以上出現している頻出単語を対象 3. 学習に使用する単語に対し前後10語くらいを見る(ちょっと多すぎだったかも) 4. 学習率は0.015で1000回学習してモデルを生成
  10. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ Word2vecで何ができるのか • 単語をベクトル化することで以下を確認することが可能 ①単語同士の意味が近い言葉を知ることができる アイカツ!

    ≒ プリパラ? ②単語同士を組み合わせた結果と意味が近い言葉を知ることがで きる アイカツ! – 女児向け + 大人向け ≒ アイドルマスター?
  11. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ Skip-Gramモデル 引用:http://www.randpy.tokyo/entry/word2vec_skip_gram_model 今日 生まれる かわる

    センセイション 全速力 : • STARTDASH SENSATIONの歌詞「今日 生まれる かわる センセイ ション 全速力 つかまえる」であれば
  12. ©BNP/BANDAI, DENTSU, TV TOKYO http://www.aikatsu.net/ DeepLearning的一番のアイカツ!曲 •アイカツ☆ステップ! • アイカツ!の類似ワードは、ほぼこの曲の歌詞 •

    アイカツおじさん的には ✓アイカツシリーズ2作目アイカツスターズ!の最初期曲 ✓ライブでもよく歌われる1曲 これは薦められる1曲!!!!!