Slide 1

Slide 1 text

2つの画像が有意に異なるのか検定した話 (トーケイのこと詳しくないけど)

Slide 2

Slide 2 text

自己紹介

Slide 3

Slide 3 text

大阪府出身 お天気の会社で環境コンサルを数年 風力発電の環境アセスでGISを使って解析したり MIERUNEには2019年11月と2023年1月に入社 何かを開発するというより、データの解析したりに興味がある X @nbayashi_n facebook 西林直哉 自己紹介

Slide 4

Slide 4 text

自己紹介 QGIS講習会 MIERUNEでのお仕事 QGISのプラグイン QGIS宣伝大使(自称) QiitaとかブログとかYoutubeとか

Slide 5

Slide 5 text

ことの発端 slackって知ってますか

Slide 6

Slide 6 text

ことの発端 アイコンでわかり やすい

Slide 7

Slide 7 text

ことの発端 ちょっとええ感じの写真を撮っても らったので、アイコンに 自分のアイコンはというと、 こんなふざけた アイコンだったのを

Slide 8

Slide 8 text

ことの発端 社内の他メンバーのアイコンに 似ていて紛らわしいということに・・

Slide 9

Slide 9 text

ことの発端 とことん似せた結果

Slide 10

Slide 10 text

そこまでいうなら、この二つがどれくらい似ているのか はっきりさせてやろう 確かに似てるけど、どれくらい似てるものなのか。 自信を持って2つの画像が違うものだと言いたい。 ことの発端 画像の取り扱いといえばOpenCVとか

Slide 11

Slide 11 text

ことの発端 OpenCVなど使えば、顔認証とか、2つの画像の特異点とか抽出できたりする(らしい)。

Slide 12

Slide 12 text

ことの発端 が、そんなことはしません 明確な根拠をもとに両者に差があると言いたい。 そこで 2つの画像が違うものであるかどうかを、みんな大好きな検定で試してみた 統計的に検定

Slide 13

Slide 13 text

「異なる2つの集団による違いが、偶然によるものであるのか、それとも何かしら意味があり必然的 に得られたものなのか」を統計的に結論付ける手法。 例えば、ある薬(例えば身長を伸ばす薬)の効果を検証するために、Aグループには実薬を、Bのグ ループには偽物の薬を与えて、両グループの伸びた身長を検証する。 この場合、AグループとBグループでそれぞれ集計したグループ内の人の伸びた身長に差があるか。 検定とは グループAの人たちの伸び た身長頻度分布 [3,4,4,5,5,5,6,6,5,7,8....] グループBの人たちの伸び た身長頻度分布 [0,1,2,2,2,3,3,3,3,4.....] 差があるか検定

Slide 14

Slide 14 text

検定とは 画像のピクセル値を集計して比較すれば、 画像の違いを検定できるのでは・・・。 画像の場合

Slide 15

Slide 15 text

帰無仮説と対立仮説 検定の考え方 対立仮説:検定によって立証したい仮説 帰無仮説:検定によって立証したいことを否定する仮説 例えばさっきの薬の例では 「薬に効力がある」ことを立証したいので、これが対立仮説。 帰無仮説は「薬は効果がない」となる。 今回の画像の場合 「両者の画像に差がある」ということを立証したいのでこれが対立仮説 「差がない」が帰無仮説となる。

Slide 16

Slide 16 text

帰無仮説と対立仮説 検定の考え方 検定においてはその帰無仮説が立証される確率を求める。これをp値という。 p値が有意水準(多くの場合は5%をとることが多い。)より低いかどうかで、帰無仮説を支持するか どうかを判定する。 (この図の例は下方2.5%、上方2.5%の両側検定の場合。片側検定の場合もある)

Slide 17

Slide 17 text

帰無仮説と対立仮説 p値が有意水準未満(< 0.05)である場合、帰無仮説が棄却され、対立仮説が採用 される。 「薬の例なら効果がある(両者に差がある)」ということになる 有意差あり 逆にp値が有意水準以上(>= 0.05)であるとき、帰無仮説が採用される。 「効果があるとは言えない(両者に違いがあるとは言えない)ということに なる。 (有意差なし)

Slide 18

Slide 18 text

「有意差なし」というのは、対立仮説(差があると言うこと)を棄却するだけである。 「差がある」の反対は「差があるとは言えない」と言うこと。 「差がある」ということが言い切れないだけで、「同じもの」とは言えない (「カラスは青くない」と言っただけ、「カラスは黒い」とは限らない) = 検定を行うにあたっていくつか注意 p値>0.05 =有意差なし(帰無仮説が採用) =「両者は同じものである」と言うことではない。

Slide 19

Slide 19 text

検定にはさまざまな手法がある。 データの特性に合わせて適切な検定手法を用いる。 t検定:パラメトリック(標本の分布が正規分布であると仮定できる場合)に使用。 等分散であるとか、比較する2つのグループに対応関係があるかどうかで、対応のあ るt検定や2標本t検定など細かく分かれる。 分散分析(ANOVA):3群以上のグループ間を検定する マンホイットニのU検定:ノンパラメトリック(正規性がない)の場合に使用 カイ二乗検定:カテゴリカルな変数の割合を比較する際に使用 検定の種類

Slide 20

Slide 20 text

検定の種類 今回は、画像のピクセル値で検定を行うので以下の条件を仮定 ノンパラメトリックである(ピクセル値の頻度分布は正規分布になっていない) パラメトリック(正規分布)とは、平均値と最頻値・中央値が一致し、それを軸として左右 対称となっている頻度分布。 (自然界の多くの現象は正規分布に成り立っていることが多い。) 人間の身長、雨粒の大きさ、ある工業製品の規格誤差など・・・

Slide 21

Slide 21 text

検定の種類 2つのグループに対応関係はない (対応関係とは) 被験者は同じ人で、薬を投与する前のデータとした後のデータなど それぞれの集団に何かしら関わりがある状態 マンホイットニのU検定を使用することにする 今回はそれぞれ独立した画像のピクセル値 西林のアイコン 鈴木氏のアイコン

Slide 22

Slide 22 text

Rで実行 必要なライブラリの読み込み 画像のインポート

Slide 23

Slide 23 text

Rで実行 画像の色素ヒストグラムを見てみる(検定には関係ない) x,y: ピクセルの座標 cc: カラーチャンネル (1=R, 2=G, 3=B)

Slide 24

Slide 24 text

Rで実行 解像度の調整 元画像は512 x 512のため262,144個のサンプルが得られることになる。 サンプルサイズが大きいと有意差が出やすいため、解像度を落とす。 便宜的に1/20にする。(26 x 26 = 676この数値が得られる) 画像のプロット

Slide 25

Slide 25 text

Rで実行 グレースケールにする カラーだと値を[r,g,b]の3次元で扱う必要があり、ややこしくなるのでグレースケールにする ピクセル値をヒストグラムにしてみる

Slide 26

Slide 26 text

Rで実行 それぞれの画像のピクセル値 [1,] [2,] [3,] . . . [,1][,2][,3]....

Slide 27

Slide 27 text

Mann-Whitney U検定 Mann-Whitney U検定 p <0.05なので、帰無仮説は棄却される。 →対立仮説が採用され、「2つの画像は差がある」ということができる

Slide 28

Slide 28 text

結論 無事、両者のアイコンは 堂々と「異なるものである。」と言い張れる。

Slide 29

Slide 29 text

どうせならもっと似ている画像でも

Slide 30

Slide 30 text

どうせならもっと似ている画像でも 画像の読み込み 画像サイズを小さくする

Slide 31

Slide 31 text

広島東洋カープ ヒストグラム 中央大学 シンシナティ・レッズ 智弁学園和歌山高等学校野球部

Slide 32

Slide 32 text

検定とは 3つ以上のグループを検定する場合 クラスカル・ウォーリス検定というものもある kruskal.test(x=list(x1,x2,x3,....)) 4つのグループで有意差があるかどうかの判定であって、それ ぞれのグループ間で有意差を見るには、一つ一つ検定を行う

Slide 33

Slide 33 text

広島東洋カープ 中央大学 シンシナティ・ レッズ 智弁学園和歌山高等学校 野球部 広島東洋カープ 中央大学 p <0.001 シンシナティ・ レッズ p <0.001 p < 0.01 智弁学園和歌山 高等学校野球部 p <0.001 p = 0.176 p = 0.2011 Mann-Whitney U検定

Slide 34

Slide 34 text

広島東洋 カープ 中央大学 シンシナティ・ レッズ 広島東洋カープ 中央大学 p <0.001 シンシナティ・ レッズ p <0.001 p < 0.01 智弁学園和歌山 高等学校野球部 p <0.001 p = 0.176 p = 0.2011 Mann-Whitney U検定 広島東洋カープ 中央大学 シンシナティ・レッズ 智弁学園和歌山高等学校野球部 中央大学 シンシナティ・レッズ 智弁学園和歌山 高等学校野球部 中央大学 シンシナティ・レッズ 有意差あり 有意差あり 有意差なし

Slide 35

Slide 35 text

課題 Mann-Whitney U検定では2群の平均値に優位な差があるかをみる。 そのためそれぞれのピクセルの並びは考慮されていない。極端にいうと、90度回転させた画像を 比較した場合、人の目では「両者は違う」と言えるが、検定的には「有意差なし」となる

Slide 36

Slide 36 text

補足 今回はアブノーマルな手段で画像を比較したわけだが、 きちんとした画像の比較手法はもちろんある。 平均二乗誤差(MSE) 2つの画像の対応するピクセル値の差分をとって、その差分の二乗を合計を全ピクセル数でわる MSEが小さければ小さいほど、両者は似ているということになる。

Slide 37

Slide 37 text

平均二乗誤差(MSE) 両者のピクセル値の差を 二乗した値を合計 全ピクセル数でわる (両者の画像のピクセル数が同じである という前提) MSEが小さければ小さいほど、両者は似ているということになる。 (どれくらい数値が大きければ両者は違うという基準はない。)

Slide 38

Slide 38 text

結論 平均二乗誤差(MSE)は、画像比較の最もシンプルな方法 ただし、 ・2つの画像のピクセル数が同じである必要がある。 ・どれくらい数値が大きければ両者は違うという基準はない。 もしあなたも何かのプロフ画像で他人と被ってしまって、 「2つの画像が違うものである」 ということを言いたければ検定してみましょう

Slide 39

Slide 39 text

終わり