問題設定
標本問題:
累積分布関数 は連続とし、 となる全ての に
おいて と仮定する。
このとき となる中央値 が一意に定まる。
両側検定
片側検定
1 X1
, … , Xn
i.i.d.
∼ F
F 0 < F (x) < 1 x
f(x) = F
′
(x) > 0
F (ξ) = 1/2 ξ
H0
: ξ = ξ0
vs. H1
: ξ ≠ ξ0
H0
: ξ ≤ ξ0
vs. H1
: ξ > ξ0
10 / 38
Slide 11
Slide 11 text
符号検定
実用的でない検定だが、説明のために紹介
のうち 以上の個数を とする。
のもとで のはずなので、両側検定は
片側検定も同様
符号検定という名前の由来 ( が無い場合)
X1
, … , Xn
ξ0
T
H0
T ∼ Bin(n, 1/2)
T −
n
2
> c ⇒ reject
Xi
= ξ0
n
∑
i=1
sign(Xi
− ξ0
) = 2T − n
11 / 38
Slide 12
Slide 12 text
ウィルコクソンの符号順位検定
が に関して対称な分布であると仮定する。
対称とは限らない に従う対応あり 標本問題の差の検定
を 標本問題に帰着させる場合は成立
とする。
が全て異なるとして、小さい順に並べ から
までの順位をつけたときの の順位を とおく。
変数 を、 のとき , のとき とする。
検定統計量
F 0
F ′
2
1
ξ0
= 0
|X1
|, … , |Xn
| 1 n
Xi
Ri
ε
i
X
i
> 0 1 X
i
≤ 0 0
W =
n
∑
i=1
εi
Ri
12 / 38
Slide 13
Slide 13 text
例
標本
絶対値を取り、小さい順に並べる
順位を割り当てる
の符号が正のもののみの順位を足す
(x1
, x2
, x3
) = (−2.5, 4.1, 0.5)
|0.5| < | − 2.5| < |4.1|
(R
1
, R
2
, R
3
) = (2, 3, 1)
xi
W = R
2
+ R
3
= 4
13 / 38
Slide 14
Slide 14 text
検定統計量 の標本分布
を固定したとき、
この条件下で の分布は以下の の分布と同じ
これが に依存しないので、条件つきでない の
分布も同じ
が小さいときは の全パターンを計算すれば良い。
が大きいときは正規分布近似を用いる
W
|X1
|, … , |Xn
| ε1
, … , εn
i.i.d.
∼ Bin(1, 1/2)
W
~
W
~
W =
n
∑
i=1
iεi
|X1
|, … , |Xn
| W
n {0, 1}
n
n
W
⋅
∼ N (
n(n + 1)
4
,
n(n + 1)(2n + 1)
24
)
14 / 38
Slide 15
Slide 15 text
の平均と分散の計算
公式
平均
分散
W
n
∑
k=1
k =
n(n + 1)
2
,
n
∑
k=1
k
2
=
n(n + 1)(2n + 1)
6
E[W ] =
n
∑
i=1
i
2
=
n(n + 1)
4
V [W ] =
n
∑
i=1
V [iεi
] =
n
∑
i=1
i2
4
=
n(n + 1)(2n + 1)
24
15 / 38
Slide 16
Slide 16 text
対応あり 標本問題からの帰着
帰無仮説において とする。 は対称とは限らない。
とおくと、 と は同じ分布
従って、 の分布は対称となり、ウィルコクソンの符号順位検定
が適用出来る。
2
X, Y ∼ F
′
F
′
Z = Y − X Z −Z = X − Y
Z
16 / 38
検定統計量 の標本分布
個の中から 個を選ぶ組み合わせの数
帰無仮説のもとではどのパターンも同様に確からしい。
が小さいときは全パターンを計算すれば良い。
が大きいときは正規分布近似を用いる
W
m + n n
( )
n + m
n
m + n
m + n
W
⋅
∼ N (
n(m + n + 1)
2
,
mn(m + n + 1)
12
)
20 / 38
Slide 21
Slide 21 text
非復元抽出と有限修正
一般に、平均 、分散 、サイズ の母集団から 個を非復
元抽出したとき、標本平均 について以下が成り立つ
分散の係数 を有限修正という。
これを当てはめると、母集団は なので、
とおくと
μ σ
2
N n
¯
X
E[ ¯
X] = μ, V [ ¯
X] =
N − n
N − 1
σ
2
n
(N − n)/(N − 1)
{1, … , m + n}
N = m + n
μ =
1
N
N
∑
i=1
i =
N + 1
2
, σ
2
=
1
N
N
∑
i=1
i
2
− μ
2
=
N
2
− 1
12
21 / 38
Slide 22
Slide 22 text
検定統計量 の平均と分散
平均
分散
W
E[W ] = E[n ¯
X] = n
N + 1
2
=
n(m + n + 1)
2
V [W ] = V [n
¯
X]
= n
2
V [ ¯
X]
= n
2
N − n
N − 1
N
2
− 1
12n
=
mn(m + n + 1)
12
22 / 38
標本問題の区間推定
ウィルコクソンの符号順位検定と対応する。
補助的な変数を導入
を小さい順に並べたときの 番目を とする。
中央値 の信頼区間
が長さ のときの値をホッジス・レーマン推定量という
1
Uij
=
X
i
+ X
j
2
, 1 ≤ i ≤ j ≤ n
Uij
k Vk
ξ
S(X) = [V
n(n+1)/4−c
, V
n(n+1)/4+c+1
]
S(X) 0
^
ξ = medi≤j
Uij
27 / 38
Slide 28
Slide 28 text
標本問題の区間推定
マン・ホイットニーの 検定と対応する。
補助的な変数を導入
を小さい順に並べたときの 番目を とする。
分布の差 の信頼区間
2
U
U
ij
= Y
j
− X
i
, i = 1, … , m, j = 1, … , n
Uij
k Vk
Δ
S(X) = [Vc
, Vmn−c+1
]
28 / 38
並べかえ検定
標本問題を例に説明する。標本サイズは , とする。
個の観測値を固定し、そこから 個を選び、任意の統計
量 の値を計算する。
これを 通りの全てまたはランダムに選んだ一部に対し
て行い の分布を求める。これを の並べかえ分布という。
の並べかえ分布に基づいて検定を行う。
2 m n
m + n n
T
( )
n + m
n
T T
T
30 / 38