確率・統計
記事内に商品プロモーションを含む場合があります

サンプリング調査のサンプルサイズを決定する方法|コクランのサンプルサイズ計算式

確率・統計関連記事
Aru

実験を行う場合や、母集団からサンプリング調査を行う場合、どれくらいの数をサンプリングすれば良いか悩みます。以下の計算式は、サンプル数を決める手助けになります。

コクランのサンプルサイズ計算式

母集団が無限の場合のサンプルサイズ計算

コクランのサンプルサイズ計算式(Cochran’s Sample Size Formula)は、サンプルサイズを決定するときに参考となる計算式です。

母集団が無限、または、非常に大きい場合は、以下の式でサンプルサイズを決定することができます。

$$
n_0 = \frac{z^2\cdot p \cdot (1-p)}{e^2}
$$

  • $e$ : 許容誤差
  • $p$:母集団における割合(わからない場合は0.5を使う)
  • $z$:Z値。信頼係数(95%の信頼水準の場合、1.96)

$e=0.05, p=0.5, z=1.96$で計算すると、以下のようになります。
$$
n_0 = \frac{1.96^2 \cdot 0.5 \cdot (1-0.5)}{0.05^2} = 384.16
$$

有限集合に対するサンプルサイズの補正

実際の研究などでは母集団は無限ではないので、補正を行う必要があります。以下が補正の式になります。基本的には、上の計算で求めたサンプルサイズを、母集団のサイズを使って補正する計算になります。


$$
n = \frac{n_0}{1+\frac{no-1}{N}}
$$

  • $n_0$ :コクランのサンプルサイズ計算式で計算したサンプルサイズ
  • $N$:母集団のサイズ

先ほど計算した値を$N=1000$で補正すると、以下のようになります。

$$
n = \frac{384.16}{1 + \frac{384.16 – 1}{1000} }\approx 278
$$

山根による簡略式

母集団のサイズがわかっている場合に関しては、以下のような簡略式もあります。

$$
n = \frac{N}{1+N\cdot e^2}
$$

  • $N$:母集団のサイズ
  • $e$ : 許容誤差

なお、この計算式は、$p=0.5$の場合に使用するものになります。

$N = 1000, e = 0.05$を当てはめて計算すると、以下のようになります。

$$
n = \frac{1000}{1+1000\cdot 0.05^2} \approx 286
$$

簡略式で計算しても、ほぼ同じ値を得ることができました。

まとめ

母集団からサンプリングして調査する場合のサンプル数の決定方法について解説しました。


メールアドレスが公開されることはありません。 が付いている欄は必須項目です

ABOUT ME
ある/Aru
ある/Aru
IT&機械学習エンジニア/ファイナンシャルプランナー(CFP®)
専門分野は並列処理・画像処理・機械学習・ディープラーニング。プログラミング言語はC, C++, Go, Pythonを中心として色々利用。現在は、Kaggle, 競プロなどをしながら悠々自適に活動中
記事URLをコピーしました