階級とは統計の基礎的手法のひとつであり、統計を取りたいデータの範囲ごとに区切って傾向を見たい場合に度数分布表を用いる手法として利用されています。特徴としてはデータの範囲と階級を自分たちで調整して統計を取ることができるという点で、データに応じて適切な範囲や階級が変わるので適切な調整が必要です。

階級の取り方としては、まずデータの数値をいくつかの範囲に分ける作業を行います。この時にどの程度の範囲に分けていくのかが重要なポイントで、範囲を広くし過ぎてしまうとデータや統計そのものの全体感がぼやけてしまうので統計としてあまり意味をなさなくなってしまいます。また狭くし過ぎると今度は度数分布にする意味がなくなってしまうため、適切な範囲と階級を決定する際にはスタージェスの公式を活用する方法が推奨されているのです。

スタージェスの公式ではデータの範囲を「(サンプル最大値-サンプル最小値)/(1+log2(サンプル数))」で算出し、適切な範囲を決定します。その後はデータの範囲に応じて階級分けをしていくのですが、その際のスタージェスの公式は「1+log2(サンプル数)」です。このようにスタージェスの公式でデータの範囲と階級を最初から計算する方法のほかにも、直感でデータの範囲や階級を分けた後に確認のために公式を使うという方法も用いられています。

このような点から統計の基礎的手法として度数分布表を用いた手法である階級の取り方は、数値化されたデータやサンプルを見やすい形で確認する際に利用しやすい方法です。ただデータの範囲や階級に関してはデータの量や内容によっては直感で振り分けることが難しいため、スタージェスの公式をうまく活用することが大切だとされています。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です