Upgrade to Pro — share decks privately, control downloads, hide ads and more …

社会性フィルター付き愚痴投稿サイト

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 社会性フィルター付き愚痴投稿サイト

Avatar for mkan0141

mkan0141

March 27, 2019
Tweet

More Decks by mkan0141

Other Decks in Technology

Transcript

  1. 自己紹介 • みかん • IS科 B3(数日後にはB4) • 自然言語処理研究室(IM) • 競プロ代表になりました✌

    • シェル芸とElm,cssが楽しい • 数時間前に死にました • 死因:わたてんの最終話を見たため Twi$er slack @mkan_0141 #5mes_mkan
  2. フロントエンド • Elm(言語) • 純粋関数型言語でUIフレームワークならぬ、UI言語 • Reduxがデフォルト • そもそもReduxはElmに影響を受けて開発された •

    UIKit(cssフレームワーク) • かなり軽量なcssフレームワーク • Elmはbootstrapとかなり相性が悪いのでこちらを採用 • 結局あまり使わなかった。
  3. バックエンド • Flask • 軽量なpython製フレームワーク • APIを作るのに採用 • Redis •

    インメモリデータベース • データをメモリ上で管理するので高速に処理ができる • 何回でもいいねできるようにしたので使用
  4. それ以外 • Juman … 形態素解析ライブラリ(品詞分解) • word2vec … 単語にベクトルを持たせることができる 単語の類似度や似ている単語を求めることができる

    • 極性辞書 … 単語に -1.0 ~ 1.0 の値を振り分けられてる辞書 -1.0に近い方がネガティブ、1.0に近い方がポジティブ • いろんなサイトのテキストデータたち    …
  5. 社会性フィルターの仕組み • 負の単語を見つけてそれを「にゃーん」に変えていく そんなこともできないのか!死ねこのゴミカスが! そんな こと も でき ない の

    か ! 死ね この ゴミ カス が ! そんな こと も でき ない の か ! 死ね この ゴミ カス が ! 形態素解析(いわゆる品詞分解) <- Juman 分解した中からネガティブな単語を抽出 <- 極性辞書 + word2vec そんな こと も でき ない の か ! にゃーん この にゃーん にゃーん が ! にゃーん <- にゃーん
  6. ネガティブ単語判定器仕組み 1. 負の単語辞書に一致するものがあるか • 極性辞書の-1.0に近い単語を抽出 • Yahoo知恵袋に「負の単語募集!」みたいなのがあったのでそこから拝 借 • 500単語くらい集まった

    2. 負の単語辞書に載っているものの中で類似するものはあるか • 1つの単語に対して辞書の500単語全ての類似度を計算 • 類似度が0.7を超えればネガティブ単語と判定する