Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
単純ベイズ分類利用のための基礎知識 #TechLunch
Search
Livesense Inc.
PRO
April 23, 2014
Technology
0
100
単純ベイズ分類利用のための基礎知識 #TechLunch
2012/04/18(水) @ Livesense TechLunch
発表者:福田 絵里
Livesense Inc.
PRO
April 23, 2014
Tweet
Share
More Decks by Livesense Inc.
See All by Livesense Inc.
27新卒_総合職採用_会社説明資料
livesense
PRO
0
1.6k
27新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
5.4k
株式会社リブセンス・転職会議 採用候補者様向け資料
livesense
PRO
0
140
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
0
1.6k
データ基盤の負債解消のためのリプレイス
livesense
PRO
0
520
26新卒_総合職採用_会社説明資料
livesense
PRO
0
12k
株式会社リブセンス会社紹介資料 / Invent the next common.
livesense
PRO
2
48k
26新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
1
13k
中途セールス職_会社説明資料
livesense
PRO
0
280
Other Decks in Technology
See All in Technology
ActiveJobUpdates
igaiga
1
330
Knowledge Work の AI Backend
kworkdev
PRO
0
290
[2025-12-12]あの日僕が見た胡蝶の夢 〜人の夢は終わらねェ AIによるパフォーマンスチューニングのすゝめ〜
tosite
0
200
AI時代のワークフロー設計〜Durable Functions / Step Functions / Strands Agents を添えて〜
yakumo
3
2.4k
_第4回__AIxIoTビジネス共創ラボ紹介資料_20251203.pdf
iotcomjpadmin
0
140
AgentCore BrowserとClaude Codeスキルを活用した 『初手AI』を実現する業務自動化AIエージェント基盤
ruzia
7
1.8k
100以上の新規コネクタ提供を可能にしたアーキテクチャ
ooyukioo
0
270
20251218_AIを活用した開発生産性向上の全社的な取り組みの進め方について / How to proceed with company-wide initiatives to improve development productivity using AI
yayoi_dd
0
740
Connection-based OAuthから学ぶOAuth for AI Agents
flatt_security
0
400
アプリにAIを正しく組み込むための アーキテクチャ── 国産LLMの現実と実践
kohju
0
240
2025年の医用画像AI/AI×medical_imaging_in_2025_generated_by_AI
tdys13
0
140
意外と知らない状態遷移テストの世界
nihonbuson
PRO
1
290
Featured
See All Featured
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
200
Abbi's Birthday
coloredviolet
0
3.9k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
0
200
Optimising Largest Contentful Paint
csswizardry
37
3.5k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
170
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Evolving SEO for Evolving Search Engines
ryanjones
0
78
RailsConf 2023
tenderlove
30
1.3k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
120
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
31
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
240
Transcript
単純ベイズ分類器 利用のための基礎知識
•事前確率 ・ある変数について知られていることを確率とし て表現するもの ・証拠なし •事後確率 ・証拠を考慮に入れた条件での変数の確率 事前確率・事後確率 相性が良い確率 0.5
相性が良い確率 0.7 データ: スポーツの趣味 が一致 初対面
「あなたは事業ネタ鑑定人です」 ・事業が成功する確率は「千に3つ」 ・それが成功ネタの時:言い当てられる確率99% ・それが失敗ネタの時:言い当てられる確率90% ある日、絶対成功ネタだ!とあなたが確信した 事業ネタに出会います。 問題:それが実際に成功ネタである確率は?? 事前確率・事後確率 (問)
「あなたは事業ネタ鑑定人です」 ・事業が成功する確率は「千に3つ」 ・それが成功ネタの時:言い当てられる確率99% ・それが失敗ネタの時:言い当てられる確率90% ある日、絶対成功ネタだ!とあなたが確信した 事業ネタに出会います。 問題:それが実際に成功ネタである確率は?? 正解:2.9% 事前確率・事後確率 (解答)
事前確率 事後確率
AのもとでBが起こる確率× Aの起こる確率 BのもとでAが起こる確率= ―――――――――――――――――――― Bの起こる確率 ベイズの定理 データ 事前確率 事後確率
データDが得られたときの原因がH 1 である確率 ベイズの基本公式 データ(結果) 仮説1(原因) = 一般化
H1 = 成功、H2 = 失敗、D = 成功判定 P(成功) = 成功ネタである確率
= 0.3% P(失敗) = 成功ネタでない確率 = 99.7% P(成功判定|成功) = 成功ネタを成功と判定する確率 = 99% P(成功判定|失敗) = 失敗ネタを成功と判定する確率 = 10% P(成功|成功判定) = 成功判定されたネタが実際に成功ネタである確率 P(成功判定|成功) × P(成功) = ――――――――――――――――――――――――――――― P(成功判定|成功) × P(成功) + P(成功判定|失敗) × P(失敗) = 2.9% 事前確率・事後確率 (解説) 事前確率 事後確率
ベイズ理論を利用して、与えられたデータを目的のカテゴリー に分類する技法。 •単純ベイズ分類器 (Naive Bayes classifier) ベイズ分類の最も簡単なもの。 カテゴリ毎に「そのカテゴリに属する文書」を使って学習。 数あるテキスト分類の技法との比較すると、 実装が簡単、高速
→ 比較的よく利用されている •補集合単純ベイズ分類器 (Complement Bayes classifier) カテゴリ毎に「そのカテゴリに属さない文書」を使って学習。 速さは単純ベイズ分類より多少劣るが、単純ベイズ分類よりも 精度が高い。 ベイズ分類器 (Bayes classifier)
※テキスト分類手法:非常に多くの研究があり、そのア ルゴリズムも大量 ナイーブベイズ、決定木、Rocchio分類法、k-最近傍法、ロジス ティック回帰、ニューラルネットワーク、サポートベクトルマシン 、ブースティング etc... ※一般的には、サポートベクトルマシンやブースティン グが他の手法と比べて高精度な分類ができると言われて いる
•Paul Grahamのスパム対策 → ベイジアンフィルタを考案 単純ベイズ分類器の適用例 学習量が増えると フィルタの分類精 度が上昇 個々の判定を間違えた
場合には、ユーザが正 しい内容に判定しなお し、再学習 数学モデル 数学モデル ( (ベイズ理論 ベイズ理論) ) スパムメール スパムではない メール トレーニング 用データ 参照 登録 元メール 再学習
→次回 単純ベイズ分類器実装
→次回 MySQL Cluster 7.2