「真の分布」の仮定は実在論的か？

「真の分布」の仮定は実在論的か？ @Fukuso_Sutaro 2021/05/30

⽬次 • 問題設定 • 「真の分布」の仮定 ≠ 実在論 • 「渡辺スライド」の構造 •
形式的結果の利⽤について

問題設定

「渡辺ベイズ」なるものへの批判の例 • 実在論の上に⽴脚している結論のネタバレ：この批判は⾃分が実在論者だと気づいていない「隠れ実在論者」からしか出てこないものである • “主義”は理論に影響する結論のネタバレ：少なくとも形式的議論で保証される範囲においては、使いやすい⼿法や発展の⽅向性への影響はあれど、理論それ⾃体にはどの“主義”を取ろうとも影響はないし、影響できない

実在論／反実在論と外在主義／内在主義 • 実在論＝「対象が認識とは関係なく実在する」 • 「客観確率」という概念と相性がよい？ • 反実在論＝「対象が認識とは関係なく実在するということはない」 •
「主観確率」という概念と相性がよい？ • 外在主義＝「信念の正当化は外的要素を含んで⾏われる」 • 「客観確率」という概念と相性がよい？ • 内在主義＝「信念の正当化は⼼的要素のみによって⾏われる」 • 「主観確率」という概念と相性がよい？ • 内在主義はさらに整合主義と基礎付け主義に分けられる：整合主義（⻫合主義）＝「信念は他の信念との整合性によって正当化される」基礎付け主義 =「基礎となる信念が他の信念を正当化する」この⾒せかけの類似が、頻度論／ベイズ (⼿法) に実在論／反実在論 (存在論) や外在主義／内在主義 (認識論) を無理⽮理に対応させる欲求を呼び起こさせる

主観確率と客観確率主観確率／客観確率の違いには「客観的事実は実在するか」という存在論のレイヤーと「いかに信念は正当化されるか」に関する認識論のレイヤーが別々にあり、おそらく多くの⼈々は互いが（そして⾃分が）どちらの分類を採⽤しているかよく確認していない • 確率を主観確率と⾒る（反実在論）か客観確率と⾒る（実在論）かで統計学の理論への影響はあるか？ → ない
• 確率を主観確率と⾒る（内在主義）か客観確率と⾒る（外在主義）かで統計学の理論への影響はあるか？ → ない某主観ベイジアン「すべての頻度、情報量基準法はベイズ的な解釈ができます」

批判の検討 • 実在論の上に⽴脚している • 「真の分布」（＝「データの発⽣源」）を置くことに対して向けられがちなもの • 「真の分布」のような形式的対象を置くことは「実在の仮定」を意味するのか？ → これがとんでもない誤読であることを説明する •
“主義”は理論に影響する • “主義”は現実世界をどう捉えるかに関係する • 形式的議論から保証される統計学の理論に対して、その影響はあるのか？ → 理論そのものには影響がない（影響することができない）ことを説明する • “主義”によって理論の中のどれがより使いやすいか、は変化する可能性がある → そういうものは“主義”ではなく“〇〇法”と呼ぶのが整合的例：「 “主観ベイズ主義”の思想・⽬的には“主観ベイズ法”が合っている」

「真の分布」の仮定 ≠ 実在論

形式的対象を置く＝実在の仮定？ • 以下のような有理数列（収束先は無理数）で近似できる現象を考える： 𝑎! = 1 𝑎"#$ = 𝑎" 2
+ 1 𝑎" • この列 𝑎" と収束先 𝑟 との差を 𝑎" − 𝑟 で表すことは、「現実世界にちょうど無理数であるような量が実在する」ことの仮定を意味するか？ → 意味しない！そのような量が実在しようとしまいと、この列 𝑎" ⾃体も列と収束先との差 𝑎" − 𝑟 も計算できるし、その計算は形式的体系の中で正当化されている • 「形式的対象を置くことはその対応物の実在を仮定することを意味しない（し、意味できない）」ということは上記の例からもわかる

現実をよく表現できる＝実在に対応？ • 超実数体 ∗ℝ による理論は「現実をよく表現できる」が、同様に実数体 ℝ による理論も「現実をよく表現できる」 • ∗ℝ
と ℝ は形式的には完全に別物である → ふたつの異なるものが現実をよく表現できている（現実をよく表現できる理論が実在に対応しているなら、超冪などの複雑な操作が間に⼊ったこれらの形式的対象はふたつの異なった実在を導いてしまう ← ⽭盾！） • input と output が「現実をよく表現できる」からといってその間の形式的対象全体が「現実をよく表現できる」と考えることもよくある間違いである例：確率論は in/out について「現実をよく表現できる」が、そこに出てくる「確率分布の積分」などといった作為的な極限操作は「現実のよい表現」か？

雑談：超実数体 ∗ℝ の構成超実数体を構成するための⽅法は様々： • 宇宙 𝑉 を別の宇宙 ∗𝑉 に埋め込み、必要な公理を追加すると、
∗𝑉 における ℝ の対応物 ∗ℝ が得られる • 𝑉 に対する超冪構成により、上記に相当する ∗ℝ が得られる • ZFC公理系に述語 st と3つの公理を加えて構成されたIST公理系から ∗ℝ が得られる …等々いずれのルートで構成するにせよ、実数体とは全く異なる形式的対象となるが、超実数体もまた「現実をよく表現できる」ものである

雑談：推論の形式 • 演繹：前提と推論規則から結論を導く • 前提：「⼈は死ぬ」「ソクラテスは⼈である」 • 推論規則：「((AならばB)かつ(BならばC))ならば(AならばC)」 • 結論：「ソクラテスは死ぬ」 •
問題点：結論の正しさは前提や推論規則の正しさに依存してしまう • 帰納：観測した個々の事実から⼀般的な法則を推定する • 観測：「10万匹の⿊いカラスを確認した」 • 結論：「カラスは⿊い」 • 問題点：観測の正しさに依らず可謬的である • アブダクション：観測された事実をよく説明できる前提を推定する • 観測：「邪⾺台国についての記述を含む資料が存在する」 • 前提：「邪⾺台国は存在した」 • 問題点：観測の正しさに依らず可謬的である

「真の分布」の仮定 ≠ 実在論 • 前ページの 2 に収束する数列の議論からわかるように、「真の分布」という形式的対象を置くことは「現実の対応物」の実在性とは関係がない • データが何らかの法則に基づいて発⽣するものでなかった（＝対応する
確率分布がない）としても、形式的議論に乗せた時点で「データの発⽣源」としての何かは仮定（≠実在性を要請）している • では、なぜ「仮定」と「実在」が関係すると錯覚してしまうのか？ → 批判者の側が理論と現実を結びつける実在論を前提としているから • 「真の分布が既知」≠「真の分布が実在しており、それが既知」 • 何らかの実在論を前提とすると、形式的議論の述語と現実の述語の区別がつきづらくなるので注意

あらゆる形式的議論は（形式的議論であるがゆえに）それ⾃⾝は実在論的仮定を内包しない！使う⼈が内⼼で実在論的仮定を置いているか否かと「理論」は独⽴したもの（⼼の中で置きたければ勝⼿に置けばよい）批判者の⾔葉渡辺ベイズの「真の分布」は混乱を⽣んでるような気がしますね。認識主体に依存しない（不変の）分布ｑから（iid的に）データが⽣成されていると仮定し… というようなメタな⽴場表明が⼊っているとわかりやすいんですが（某脳情報科学者）
（科学的）実在主義の⼈って全ての⼈が実在主義だと思ってる節はある。でベイズは常に「あなた」の仮定だから実在に対してはなにも仮定してないと思ってる。例えば正規性の仮定は「あなた」の（様々な制約のもとでの）仮定であって、世界が正規性を持ってると仮定してるとは⾔えない、⾔及してない。つまり頻度論だと「データが正規分布に従うと仮定する」と強い実在論的仮定だけど、ベイズだと「未知の不確実性を私は正規性で表現する」とあくまで主観的表現なので間違えてたら表現を変えればいいだけ。（某主観ベイジアン）

「渡辺スライド」の構造

「渡辺スライド」への批判 • 「渡辺スライド」には以下のような批判が向けられている： • しかし、以下のスライド群を⾒てみると…… 「主義」を⼼配するみなさまに決定理論とベイズ法⼩さな世界と⼤きな世界「形式的議論の述語」と「現実の述語」がそれぞれ分けられて整合的に記述されていることがわかる
→ 批判者側が実在論に⽴ってとんでもない誤読をしていることがわかるまあ、いろんな⽴場があっていいと思いますが、⾃分がある種の科学実在論をナイーブに受け⼊れているからといって、他の⼈もみんなそうであると決めつけるのはやめてほしい（某脳情報科学者）

「渡辺スライド」における述語の選択 • 主義を⼼配するみなさまにではとして、現実世界で「真の分布」はわからない（現実の述語）としている • そして、数学的な法則は「未知の分布」が何であっても成り⽴つと明⾔している（形式的議論＝ただの整合的な記号列なので、アタリマエ） • 決定理論とベイズ法
ではとして、「真の分布」がわかる（形式的議論の述語）場合の話をしているデータを発⽣している真の分布は不明である。→ 真が不明であるのに、（⼈間が恣意的に⽤意した）モデルと事前分布を使い、好きな⽅法で推測している。しかし、これは統計学の到着点ではなく、出発点です。未知の分布がわからないのに「未知と推測」の誤差を知るためには未知の分布が何であっても成り⽴つ数学的な法則が必要だからです。真の事前分布と真のモデルが既知であるとする。

「渡辺スライド」の構造 • 「渡辺スライド」では⼀貫して「形式的議論外」の統計的議論に現実の述語を、「形式的議論」においては形式的議論の述語を使うという形で、“主義”の影響が及ばない形式的議論の世界とそれ以外を慎重に分離している • なぜか？→ 論理的に保証されるものとそれ以外を切り分けなければ、論理的に保証された結果を精確に扱うことができない（正当化できない）
から • この構造は、実在論の前提を勝⼿に置かない限り誤って理解してしまうことはない → 冷静にフラットに読めば誰でもわかること

形式的結果の利⽤について

形式的結果の「実在論的利⽤」 • 形式的体系の上での形式的議論による形式的結果は、あくまでも形式的体系の上で「使ってよい」とわかったものである • 形式的結果が指し⽰すのは現実におけるその対応物のふるまいではなく、こういう仮定のもとでこういう操作をすればこうなるという関係のみであり、形式的結果から現実世界について知ろうとするのは明らかに実在論を前提とした欲求である ←
あってもなくても理論には影響しない • 某主観ベイジアンの「統計学はそれ（数学）を通して世界を認識することだ」という⽴場はかなり強固な実在論であることがわかる

⽣態学における例「⽣物の捕⾷／被⾷関係による個体数の変動」のモデリングに⽤いるロトカ・ヴォルテラ⽅程式それ⾃体は「⽣物の捕⾷／被⾷関係による個体数の変動」を表すものと解釈できるのか？ 𝑥$ & = 𝑎𝑥$ − 𝑏𝑥$
𝑥' 𝑥' & = 𝑐𝑥$𝑥' − 𝑑𝑥' → できない！「こういう仮定を置けばこう記述される」という「論理的関係」を表しているだけで、 𝑥$ と 𝑥' が「個体数」を表しているわけではないあくまでも特定状況下でのモデリングに使いやすい微分⽅程式というだけ

雑談：反証可能性 • カール・ポパーは「科学」の重要な定義に反証可能性を挙げた → この「科学」の定義は現在でも広く合意されている • 「形式的議論は現実に対応している」という前提を疑うのは「数学」のディシプリンであり、他の学問分野に持ち込んではいけないという批判は正当か？ →
ディシプリンを理由に（超準モデルなどの例を考慮すると）怪しくなるような前提を崩さない＝「反証可能性」を捨てている ※そもそも物理学や⼯学にもそういう“慎重”な⼈は⼤勢いる • 個⼈の⽴場としてではなくその分野のディシプリンとして実在論を前提とするなら、ポパーの「科学」定義は捨てなければならない

では、統計学は現実に使えないのか？形式的議論から現実世界について知ることができない（＝「統計学は数学ではない」）のなら、実在論を前提としないと統計学は現実に使えないのか？ → そんなことはない！形式的結果の「実在論的利⽤」をしなくとも統計学は多くの⽰唆を与えてくれる → 本⽇の最初の発表に帰着する

まとめ • 「主義によらないベイズ統計学」であるいわゆる「渡辺ベイズ」への「実在論の上に⽴脚している」という批判は、むしろ批判者の側が強固な実在論を⽀持しているが故に発⽣する藁⼈形論法である • 「統計学は数学ではない」からこそ、形式的議論から正当化されることと現実世界のことを混同してはいけない

雑談：公理と定義 • 某主観ベイジアンは Savage の選好順序による公理的な基礎付け⽅法を「公理的ベイズ」と呼ぶが、これは⼀般的な「公理的〇〇」の⽤法ではない • 「群の公理」に基づいて展開される「群論」を「公理的群論」とは呼ばない • Savage
の⽅法を含め、公理による「定義」を持つものを「公理的」と呼べば現代的な形式的議論のほとんどは「公理的」という接頭辞を必要とすることになる（Savage の⽅法はただの「定義」） → 「公理」というと凄そうに聞こえるが、やっているのはアタリマエのこと • 「公理的〇〇」とは、基礎的概念の導⼊と公理により新たに形式的体系をつくる⽅法を指す（Savage の⽅法は通常の体系の上でのただの「定義」）ユークリッド幾何 → 点・線・⾯などの導⼊とそれらの間の関係の記述 𝑃𝐴 → 0 および後者関数 suc の導⼊とそれらの間の関係の記述 𝑍𝐹 → 記号 ∈ および⼀階述語論理の導⼊とそれらによる集合についての記述

「真の分布」の仮定は実在論的か？

「真の分布」の仮定は実在論的か？

Fukuso Sutaro

Other Decks in Science

Featured

Transcript