Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「真の分布」の仮定は実在論的か?
Search
Fukuso Sutaro
June 07, 2021
Science
5
2.3k
「真の分布」の仮定は実在論的か?
とある会で発表したときの資料をちょっと整理したものです。いわゆる「渡辺ベイズ」とされるものへの批判で完全にブーメランになっている部分についてまとめました。
Fukuso Sutaro
June 07, 2021
Tweet
Share
Other Decks in Science
See All in Science
機械学習を支える連続最適化
nearme_tech
PRO
1
150
Pericarditis Comic
camkdraws
0
1.2k
山形とさくらんぼに関するレクチャー(YG-900)
07jp27
1
220
Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_LT版
hayataka88
0
930
Snowflakeによる統合バイオインフォマティクス
ktatsuya
0
490
インフラだけではない MLOps の話 @事例でわかるMLOps 機械学習の成果をスケールさせる処方箋 発売記念
icoxfog417
2
580
(Forkwell Library #48)『詳解 インシデントレスポンス』で学び倒すブルーチーム技術
scientia
2
1.4k
(論文読み)贈り物の交換による地位の競争と社会構造の変化 - 文化人類学への統計物理学的アプローチ -
__ymgc__
1
110
Презентация программы магистратуры СПбГУ "Искусственный интеллект и наука о данных"
dscs
0
390
作業領域内の障害物を回避可能なバイナリマニピュレータの設計 / Design of binary manipulator avoiding obstacles in workspace
konakalab
0
160
Machine Learning for Materials (Lecture 8)
aronwalsh
0
410
白金鉱業Meetup Vol.15 DMLによる条件付処置効果の推定_sotaroIZUMI_20240919
brainpadpr
1
490
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Speed Design
sergeychernyshev
25
620
KATA
mclloyd
29
14k
Code Review Best Practice
trishagee
64
17k
The Language of Interfaces
destraynor
154
24k
Code Reviewing Like a Champion
maltzj
520
39k
How to train your dragon (web standard)
notwaldorf
88
5.7k
Bash Introduction
62gerente
608
210k
Thoughts on Productivity
jonyablonski
67
4.3k
Agile that works and the tools we love
rasmusluckow
327
21k
Music & Morning Musume
bryan
46
6.2k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
Transcript
「真の分布」の仮定は 実在論的か? @Fukuso_Sutaro 2021/05/30
⽬次 • 問題設定 • 「真の分布」の仮定 ≠ 実在論 • 「渡辺スライド」の構造 •
形式的結果の利⽤について
問題設定
「渡辺ベイズ」なるものへの批判の例 • 実在論の上に⽴脚している 結論のネタバレ:この批判は⾃分が実在論者だと気づいていない 「隠れ実在論者」からしか出てこないものである • “主義”は理論に影響する 結論のネタバレ:少なくとも形式的議論で保証される範囲においては、 使いやすい⼿法や発展の⽅向性への影響はあれど、理論それ⾃体には どの“主義”を取ろうとも影響はないし、影響できない
実在論/反実在論と外在主義/内在主義 • 実在論 =「対象が認識とは関係なく実在する」 • 「客観確率」という概念と相性がよい? • 反実在論 =「対象が認識とは関係なく実在するということはない」 •
「主観確率」という概念と相性がよい? • 外在主義 =「信念の正当化は外的要素を含んで⾏われる」 • 「客観確率」という概念と相性がよい? • 内在主義 =「信念の正当化は⼼的要素のみによって⾏われる」 • 「主観確率」という概念と相性がよい? • 内在主義はさらに整合主義と基礎付け主義に分けられる: 整合主義(⻫合主義)=「信念は他の信念との整合性によって正当化される」 基礎付け主義 =「基礎となる信念が他の信念を正当化する」 この⾒せかけの類似が、頻度論/ベイズ (⼿法) に実在論/反実在論 (存在論) や 外在主義/内在主義 (認識論) を無理⽮理に対応させる欲求を呼び起こさせる
主観確率と客観確率 主観確率/客観確率の違いには「客観的事実は実在するか」という 存在論のレイヤーと「いかに信念は正当化されるか」に関する 認識論のレイヤーが別々にあり、おそらく多くの⼈々は互いが(そして ⾃分が)どちらの分類を採⽤しているかよく確認していない • 確率を主観確率と⾒る(反実在論)か客観確率と⾒る(実在論)かで 統計学の理論への影響はあるか? → ない
• 確率を主観確率と⾒る(内在主義)か客観確率と⾒る(外在主義)かで 統計学の理論への影響はあるか? → ない 某主観ベイジアン「すべての頻度、情報量基準法はベイズ的な解釈ができます」
批判の検討 • 実在論の上に⽴脚している • 「真の分布」(=「データの発⽣源」)を置くことに対して向けられがちなもの • 「真の分布」のような形式的対象を置くことは「実在の仮定」を意味するのか? → これがとんでもない誤読であることを説明する •
“主義”は理論に影響する • “主義”は現実世界をどう捉えるかに関係する • 形式的議論から保証される統計学の理論に対して、その影響はあるのか? → 理論そのものには影響がない(影響することができない)ことを説明する • “主義”によって理論の中のどれがより使いやすいか、は変化する可能性がある → そういうものは“主義”ではなく“〇〇法”と呼ぶのが整合的 例:「 “主観ベイズ主義”の思想・⽬的には“主観ベイズ法”が合っている」
「真の分布」の仮定 ≠ 実在論
形式的対象を置く=実在の仮定? • 以下のような有理数列(収束先は無理数)で近似できる現象を考える: 𝑎! = 1 𝑎"#$ = 𝑎" 2
+ 1 𝑎" • この列 𝑎" と収束先 𝑟 との差を 𝑎" − 𝑟 で表すことは、「現実世界に ちょうど無理数であるような量が実在する」ことの仮定を意味するか? → 意味しない! そのような量が実在しようとしまいと、この列 𝑎" ⾃体も列と収束先との差 𝑎" − 𝑟 も計算できるし、その計算は 形式的体系の中で正当化されている • 「形式的対象を置くことはその対応物の実在を仮定することを 意味しない(し、意味できない)」ということは上記の例からもわかる
現実をよく表現できる=実在に対応? • 超実数体 ∗ℝ による理論は「現実をよく表現できる」が、同様に 実数体 ℝ による理論も「現実をよく表現できる」 • ∗ℝ
と ℝ は形式的には完全に別物である → ふたつの異なるものが現実をよく表現できている(現実をよく表現できる 理論が実在に対応しているなら、超冪などの複雑な操作が間に⼊った これらの形式的対象はふたつの異なった実在を導いてしまう ← ⽭盾!) • input と output が「現実をよく表現できる」からといって その間の形式的対象全体が「現実をよく表現できる」と考えることも よくある間違いである 例:確率論は in/out について「現実をよく表現できる」が、そこに出てくる 「確率分布の積分」などといった作為的な極限操作は「現実のよい表現」か?
雑談:超実数体 ∗ℝ の構成 超実数体を構成するための⽅法は様々: • 宇宙 𝑉 を別の宇宙 ∗𝑉 に埋め込み、必要な公理を追加すると、
∗𝑉 における ℝ の対応物 ∗ℝ が得られる • 𝑉 に対する超冪構成により、上記に相当する ∗ℝ が得られる • ZFC公理系に述語 st と3つの公理を加えて構成されたIST公理系から ∗ℝ が得られる …等々 いずれのルートで構成するにせよ、実数体とは全く異なる形式的対象 となるが、超実数体もまた「現実をよく表現できる」ものである
雑談:推論の形式 • 演繹:前提と推論規則から結論を導く • 前提:「⼈は死ぬ」「ソクラテスは⼈である」 • 推論規則:「((AならばB)かつ(BならばC))ならば(AならばC)」 • 結論:「ソクラテスは死ぬ」 •
問題点:結論の正しさは前提や推論規則の正しさに依存してしまう • 帰納:観測した個々の事実から⼀般的な法則を推定する • 観測:「10万匹の⿊いカラスを確認した」 • 結論:「カラスは⿊い」 • 問題点:観測の正しさに依らず可謬的である • アブダクション:観測された事実をよく説明できる前提を推定する • 観測:「邪⾺台国についての記述を含む資料が存在する」 • 前提:「邪⾺台国は存在した」 • 問題点:観測の正しさに依らず可謬的である
「真の分布」の仮定 ≠ 実在論 • 前ページの 2 に収束する数列の議論からわかるように、「真の分布」 という形式的対象を置くことは「現実の対応物」の実在性とは関係がない • データが何らかの法則に基づいて発⽣するものでなかった(=対応する
確率分布がない)としても、形式的議論に乗せた時点で「データの 発⽣源」としての何かは仮定(≠実在性を要請)している • では、なぜ「仮定」と「実在」が関係すると錯覚してしまうのか? → 批判者の側が理論と現実を結びつける実在論を前提としているから • 「真の分布が既知」≠「真の分布が実在しており、それが既知」 • 何らかの実在論を前提とすると、形式的議論の述語と現実の述語の区別が つきづらくなるので注意
あらゆる形式的議論は(形式的議論であるがゆえに)それ⾃⾝は実在論的 仮定を内包しない! 使う⼈が内⼼で実在論的仮定を置いているか否かと 「理論」は独⽴したもの(⼼の中で置きたければ勝⼿に置けばよい) 批判者の⾔葉 渡辺ベイズの「真の分布」は混乱を⽣んでるような気がしますね。認識主体に依存しな い(不変の)分布qから(iid的に)データが⽣成されていると仮定し… というような メタな⽴場表明が⼊っているとわかりやすいんですが (某脳情報科学者)
(科学的)実在主義の⼈って全ての⼈が実在主義だと思ってる節はある。でベイズは常 に「あなた」の仮定だから実在に対してはなにも仮定してないと思ってる。例えば正規 性の仮定は「あなた」の(様々な制約のもとでの)仮定であって、世界が正規性を持っ てると仮定してるとは⾔えない、⾔及してない。つまり頻度論だと「データが正規分布 に従うと仮定する」と強い実在論的仮定だけど、ベイズだと「未知の不確実性を私は正 規性で表現する」とあくまで主観的表現なので間違えてたら表現を変えればいいだけ。 (某主観ベイジアン)
「渡辺スライド」の構造
「渡辺スライド」への批判 • 「渡辺スライド」には以下のような批判が向けられている: • しかし、以下のスライド群を⾒てみると…… 「主義」を⼼配するみなさまに 決定理論とベイズ法 ⼩さな世界と⼤きな世界 「形式的議論の述語」と「現実の述語」がそれぞれ分けられて整合的に 記述されていることがわかる
→ 批判者側が実在論に⽴ってとんでもない誤読をしていることがわかる まあ、いろんな⽴場があっていいと思いますが、⾃分がある種の科学実在論をナイーブ に受け⼊れているからといって、他の⼈もみんなそうであると決めつけるのはやめてほ しい(某脳情報科学者)
「渡辺スライド」における述語の選択 • 主義を⼼配するみなさまに では として、現実世界で「真の分布」はわからない(現実の述語)としている • そして、数学的な法則は「未知の分布」が何であっても成り⽴つと 明⾔している(形式的議論=ただの整合的な記号列なので、アタリマエ) • 決定理論とベイズ法
では として、「真の分布」がわかる(形式的議論の述語)場合の話をしている データを発⽣している真の分布は不明である。→ 真が不明であるのに、(⼈間が恣意的 に⽤意した)モデルと事前分布を使い、好きな⽅法で推測している。 しかし、これは統計学の到着点ではなく、出発点です。 未知の分布がわからないのに「未知と推測」の誤差を知るためには未知の分布が何で あっても成り⽴つ数学的な法則が必要だからです。 真の事前分布と真のモデルが既知であるとする。
「渡辺スライド」の構造 • 「渡辺スライド」では⼀貫して「形式的議論外」の統計的議論に 現実の述語を、「形式的議論」においては形式的議論の述語を使う という形で、“主義”の影響が及ばない形式的議論の世界とそれ以外を 慎重に分離している • なぜか?→ 論理的に保証されるものとそれ以外を切り分けなければ、 論理的に保証された結果を精確に扱うことができない(正当化できない)
から • この構造は、実在論の前提を勝⼿に置かない限り誤って理解して しまうことはない → 冷静にフラットに読めば誰でもわかること
形式的結果の利⽤について
形式的結果の「実在論的利⽤」 • 形式的体系の上での形式的議論による形式的結果は、あくまでも 形式的体系の上で「使ってよい」とわかったものである • 形式的結果が指し⽰すのは現実におけるその対応物のふるまいではなく、 こういう仮定のもとでこういう操作をすればこうなるという関係のみ であり、形式的結果から現実世界について知ろうとするのは明らかに 実在論を前提とした欲求である ←
あってもなくても理論には影響しない • 某主観ベイジアンの「統計学はそれ(数学)を通して世界を認識すること だ」という⽴場はかなり強固な実在論であることがわかる
⽣態学における例 「⽣物の捕⾷/被⾷関係による個体数の変動」のモデリングに⽤いる ロトカ・ヴォルテラ⽅程式それ⾃体は「⽣物の捕⾷/被⾷関係による 個体数の変動」を表すものと解釈できるのか? 𝑥$ & = 𝑎𝑥$ − 𝑏𝑥$
𝑥' 𝑥' & = 𝑐𝑥$𝑥' − 𝑑𝑥' → できない! 「こういう仮定を置けばこう記述される」 という「論理的関係」を表しているだけで、 𝑥$ と 𝑥' が「個体数」を表しているわけではない あくまでも特定状況下でのモデリングに使いやすい微分⽅程式というだけ
雑談:反証可能性 • カール・ポパーは「科学」の重要な定義に反証可能性を挙げた → この「科学」の定義は現在でも広く合意されている • 「形式的議論は現実に対応している」という前提を疑うのは 「数学」のディシプリンであり、他の学問分野に持ち込んではいけない という批判は正当か? →
ディシプリンを理由に(超準モデルなどの例を考慮すると)怪しく なるような前提を崩さない=「反証可能性」を捨てている ※そもそも物理学や⼯学にもそういう“慎重”な⼈は⼤勢いる • 個⼈の⽴場としてではなくその分野のディシプリンとして実在論を 前提とするなら、ポパーの「科学」定義は捨てなければならない
では、統計学は現実に使えないのか? 形式的議論から現実世界について知ることができない(=「統計学は 数学ではない」)のなら、実在論を前提としないと統計学は現実に 使えないのか? → そんなことはない! 形式的結果の「実在論的利⽤」をしなくとも 統計学は多くの⽰唆を与えてくれる → 本⽇の最初の発表に帰着する
まとめ • 「主義によらないベイズ統計学」であるいわゆる「渡辺ベイズ」への 「実在論の上に⽴脚している」という批判は、むしろ批判者の側が 強固な実在論を⽀持しているが故に発⽣する藁⼈形論法である • 「統計学は数学ではない」からこそ、形式的議論から正当化される ことと現実世界のことを混同してはいけない
雑談:公理と定義 • 某主観ベイジアンは Savage の選好順序による公理的な基礎付け⽅法を 「公理的ベイズ」と呼ぶが、これは⼀般的な「公理的〇〇」の⽤法ではない • 「群の公理」に基づいて展開される「群論」を「公理的群論」とは呼ばない • Savage
の⽅法を含め、公理による「定義」を持つものを「公理的」と 呼べば現代的な形式的議論のほとんどは「公理的」という接頭辞を 必要とすることになる(Savage の⽅法はただの「定義」) → 「公理」というと凄そうに聞こえるが、やっているのはアタリマエのこと • 「公理的〇〇」とは、基礎的概念の導⼊と公理により新たに形式的体系を つくる⽅法を指す(Savage の⽅法は通常の体系の上でのただの「定義」) ユークリッド幾何 → 点・線・⾯などの導⼊とそれらの間の関係の記述 𝑃𝐴 → 0 および後者関数 suc の導⼊とそれらの間の関係の記述 𝑍𝐹 → 記号 ∈ および⼀階述語論理の導⼊とそれらによる集合についての記述