Upgrade to Pro — share decks privately, control downloads, hide ads and more …

予測モデル with ベイズの定理 #TechLunch

予測モデル with ベイズの定理 #TechLunch

2012/03/21(水) @ Livesense TechLunch
発表者:福田 絵里

Livesense Inc.

April 23, 2014
Tweet

More Decks by Livesense Inc.

Other Decks in Technology

Transcript

  1.   •会話 予測モデルの構築・適用例 付き合いが長いと、 相手の求めているも のが分かってくる 思った通りの行動を しなかった場合は、再学習 蓄積された データ

    参照 登録 相手の表情・ 態度・言葉 発言 予測 モデル 「最近◦◦さんのことがよく分かっ てきた」 = 「最近◦◦さんについて予測モデ ルが出来上がってきた」
  2.   •Paul Grahamのスパム対策 → ベイジアンフィルタを考案 予測モデルの構築・適用例 学習量が増えると フィルタの分類精 度が上昇 個々の判定を間違えた

    場合には、ユーザが正 しい内容に判定しなお し、再学習 数学モデル 数学モデル ( (ベイズ理論 ベイズ理論) ) スパムメール スパムではない メール トレーニング 用データ 参照 登録 元メール 再学習
  3. 未来を予測するための確率論 客観的確率論 主観的確率論 対 ・古典的、頻度主義 ・「このサイコロを無限回ふった ときに1の目が出る頻度」 ・(起こって欲しい事柄の数)/(全 ての可能性の事柄の数) =

    確率 ・誰が計算しても同じ確率になる ・1980年代、コンピュータの分野 で盛んに ・ベイズ主義、ベイズの定理利用 ・「次にこのサイコロをふったと きに、1の目が出る確率」 ・確信が持てる度合い=確率 ・1990年代に広まり始める ex) モンティ・ホール問題 http://ishi.blog2.fc2.com/blog-entry-182.html 直感で正しいと思える解答 実際の解答 トーマス・ベイズ (1702年 - 1761年)
  4. •膨大なデータを実際的な洞察に変える手段を提供 ナイーブベイズの適用例 ネット関連 クリックストリーム分析、コンテンツの自動分類 自然言語処理 文字解析、文法解析 コールセンター 声の抑揚をマネージャへアラート 資源 石油・ガス・鉱物資源の発見、早期採掘

    警察・消防 犯罪・火災の原因分析、予測と阻止 流通 最適な棚割りの発見、需要予測 医薬、医療 新薬開発のコストダウン、疾病の早期発見 宇宙工学 金属材料特性の改良、化学燃料の品質管理
  5. •クリックストリーム   Webサイトの訪問者がページを渡り歩いた「軌跡」 •以下の問題の調査・改善に役立つ   使い勝手(ユーザビリティ)が悪いのはどの要素か?   Webサイト全体の構成やナビゲーションに問題はないか?   サイト運営者の意図通りに訪問者がサイトを使いこなしているか?  など •ソリューション   Apache Mahout

    (Hadoopを利用し並列演算)   HadoopディストリビューションのCDH3 (分析の高速化に貢献)   TeradataベースのSingularityプロジェクト (ex. eBay)   Coremetrics Analytics (トランスコスモス社販売のアクセス解析ツール)   SAS, SPSS Extra : クリックストリーム分析