何らかの集団の傾向を掴むためには統計を取る必要がありますが、その集団の数があまりにも膨大な場合その全てを調査していては非効率ですし、時間も人も膨大な数が必要になってしまいます。では、どうしたら良いのかですが、それはサンプル数を抽出することで全体の傾向を掴みます。実際にはどれくらいのサンプル数を取れば良いのでしょうか。統計の基礎的手法であるサンプル数取り方を理解しておかなければなりません。

そのサンプル数取り方は次の式から導き出すことが出来ます。n = N/[(ε/μ(α))2×{(N-1)/ρ(1-ρ)}+1]です。

nは必要サンプル数で、Nは調査したい母集団の大きさ、εは精度、μ(α)は信頼度100-αのときの正規分布の値、ρは母比率(nが最も大きくなるのは0.5)になります。このことからわかるのは、必要なサンプル数は調査結果の信頼度と精度によって変わってくるということです。

具体的な例を出すと、10万人の母集団で調査をする場合で信頼度95%を出す場合の必要サンプル数を見ていきます。信頼度95%のμ(α)は1.96(99%なら2.58)になり、精度を上下3%くらいとするとρ=0.5になります。これを式に当てはめるとn = 100000/[(0.03/1.96)2×{(99999)/0.25)}+1]という形になります。これを計算すると1056になるので、1056人のサンプル数を集めることが出来れば、誤差の範囲が3%で95%の信頼度の統計を取ることが可能です。

基本的に母集団の数が多くなればなるほど必要なサンプル数は増えるのですが、母集団が100万なら1065、1000万なら1067とある程度の母集団になるとケタが変わっても必要なサンプル数に大差はなくなります。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です