Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
予測モデル with ベイズの定理 #TechLunch
Search
Livesense Inc.
PRO
April 23, 2014
Technology
80
0
Share
予測モデル with ベイズの定理 #TechLunch
2012/03/21(水) @ Livesense TechLunch
発表者:福田 絵里
Livesense Inc.
PRO
April 23, 2014
More Decks by Livesense Inc.
See All by Livesense Inc.
Rubyはただの⾔語に⾮ず
livesense
PRO
0
50
28新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
61
27新卒_総合職採用_会社説明資料
livesense
PRO
0
4.9k
27新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
9.4k
株式会社リブセンス・転職会議 採用候補者様向け資料
livesense
PRO
0
390
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
1
1.7k
データ基盤の負債解消のためのリプレイス
livesense
PRO
0
620
26新卒_総合職採用_会社説明資料
livesense
PRO
0
13k
株式会社リブセンス会社紹介資料 / Invent the next common.
livesense
PRO
2
64k
Other Decks in Technology
See All in Technology
layerx-fde-practices
cipepser
5
1.4k
キャリア25年目にしてTypeScript に出会うまで - 「型」を通じて振り返るプログラミング言語遍歴 / Meeting TypeScript After 25 Years in Tech - Looking Back at My Programming Language Journey Through "Types"
bitkey
PRO
2
170
AIAgentと取り組むKaggle
508shuto
2
500
Terragrunt x Snowflake + dbt で作るマルチテナントなデータ基盤構築プラットフォーム
gak_t12
0
540
AI時代に改めて考える、ドメイン駆動設計 - モデリングが「AIへの共通言語」になる
littlehands
5
980
【新卒研修】ライブデモ + compose.yaml読解_講義資料
dip_tech
PRO
0
130
freee-mcpを Local→Remote で出してわかった MCP認可実装のリアル
terara
2
460
checker.tsにチキンレースを仕掛けてみた:型エラー(TS2589)が発生する境界線を求めて
hal_spidernight
1
110
TSKaigi 2026 - 型プラグインシステムの実装に使われるテクニック
teamlab
PRO
1
160
CARTA HOLDINGS エンジニア向け 採用ピッチ資料 / CARTA-GUIDE-for-Engineers
carta_engineering
0
47k
JaSSTに関わることで変わった人生観 #jasstnano
makky_tyuyan
0
170
AWSアップデートから考える継続的な運用改善
toru_kubota
2
360
Featured
See All Featured
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
55k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
230
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
230
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
65
54k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
220
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
360
Measuring & Analyzing Core Web Vitals
bluesmoon
9
830
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
430
Rails Girls Zürich Keynote
gr2m
96
14k
Paper Plane
katiecoart
PRO
1
50k
Transcript
予測モデル with ベイズの定理
•スパムメールか?否か? •携帯電話の買い替えが起こるか? •クレジットカードがどれくらい不正利用されるだろうか? •異性は次にどんな行動を取るか? 未来を予測する 予測モデルの 構築・適用
•会話 予測モデルの構築・適用例 付き合いが長いと、 相手の求めているも のが分かってくる 思った通りの行動を しなかった場合は、再学習 蓄積された データ
参照 登録 相手の表情・ 態度・言葉 発言 予測 モデル 「最近◦◦さんのことがよく分かっ てきた」 = 「最近◦◦さんについて予測モデ ルが出来上がってきた」
•Paul Grahamのスパム対策 → ベイジアンフィルタを考案 予測モデルの構築・適用例 学習量が増えると フィルタの分類精 度が上昇 個々の判定を間違えた
場合には、ユーザが正 しい内容に判定しなお し、再学習 数学モデル 数学モデル ( (ベイズ理論 ベイズ理論) ) スパムメール スパムではない メール トレーニング 用データ 参照 登録 元メール 再学習
未来を予測するための確率論 客観的確率論 主観的確率論 対 ・古典的、頻度主義 ・「このサイコロを無限回ふった ときに1の目が出る頻度」 ・(起こって欲しい事柄の数)/(全 ての可能性の事柄の数) =
確率 ・誰が計算しても同じ確率になる ・1980年代、コンピュータの分野 で盛んに ・ベイズ主義、ベイズの定理利用 ・「次にこのサイコロをふったと きに、1の目が出る確率」 ・確信が持てる度合い=確率 ・1990年代に広まり始める ex) モンティ・ホール問題 http://ishi.blog2.fc2.com/blog-entry-182.html 直感で正しいと思える解答 実際の解答 トーマス・ベイズ (1702年 - 1761年)
•もっとも簡単なベイズの技術 ベイズの定理をそのまま素直に適用したアルゴリズム (ナイーブ←「純粋でありのまま」) ベイズの定理の基本 『ナイーブベイズ』 データ アルゴリズム
モデル 出力 (有益な情報) 信頼度 •データの各属性を独立したものとして扱う データ「顧客」の属性の例:年齢、性別、地域、年収
•膨大なデータを実際的な洞察に変える手段を提供 ナイーブベイズの適用例 ネット関連 クリックストリーム分析、コンテンツの自動分類 自然言語処理 文字解析、文法解析 コールセンター 声の抑揚をマネージャへアラート 資源 石油・ガス・鉱物資源の発見、早期採掘
警察・消防 犯罪・火災の原因分析、予測と阻止 流通 最適な棚割りの発見、需要予測 医薬、医療 新薬開発のコストダウン、疾病の早期発見 宇宙工学 金属材料特性の改良、化学燃料の品質管理
•教師付きモデル (Supervised Model) 既に結果の分かっているデータを「教師」として、構築されるモデル •目的指向型モデル 予測することを目的に作られているモデル ナイーブベイズのモデル モデル 出力 (有益な情報)
信頼度 知見の可視化 知見の信頼度や 価値の評価
•予備法 (精度劣るが高速) ・全データのうち一定の割合を、モデル構築に利用 ・残りのデータを、モデル精度のテストに利用 →誤差率を算出 •相互検証法 (予備法よりも精度良い) ・モデル構築用データ、モデル精度テスト用データをすり替えて、 予備法をn回繰り返す →n個の誤差率が得られ、それらを平均した推定誤差を算出
•ブートストラップ (さらに精度良い) ・モデル構築までは、相互検証法と同じ ・ただしモデルテスト時、誤った予測が行われたデータの重みを調整 →予測精度の向上 ナイーブベイズモデルの精度測定
•クリックストリーム Webサイトの訪問者がページを渡り歩いた「軌跡」 •以下の問題の調査・改善に役立つ 使い勝手(ユーザビリティ)が悪いのはどの要素か? Webサイト全体の構成やナビゲーションに問題はないか? サイト運営者の意図通りに訪問者がサイトを使いこなしているか? など •ソリューション Apache Mahout
(Hadoopを利用し並列演算) HadoopディストリビューションのCDH3 (分析の高速化に貢献) TeradataベースのSingularityプロジェクト (ex. eBay) Coremetrics Analytics (トランスコスモス社販売のアクセス解析ツール) SAS, SPSS Extra : クリックストリーム分析
→次回 ナイーブベイズ実践