実験データから母集団の割合の推定

実験データから、全体(母集団)を推定する方法の計算式です。

赤玉と白玉が入っている袋があり、そこから何回か取り出す、という想定で計算します。

100回取り出してみて、赤45白55だった場合、このサンプルデータからは赤が45%です。しかし、全体(母集団)ではぴったり45%とは限りませんね。もしかしたら赤玉白玉はちょうど半々で、たまたま45個と55個だった可能性もあります。一方で、赤の割合が10%、という可能性はかなり低そうですね。母集団での赤玉の割合は、ぴったり45%ではないとしても、45%の近辺になりそうです。

このように、サンプルデータから母集団を推定する場合の計算式です。

赤玉の割合は、% 〜 % の間である可能性が95%です。

赤玉の割合は、% 〜 % の間である可能性が99%です。

計算は、まず標準誤差を計算します。

標準誤差 = √ (赤の割合 * 白の割合 / サンプルデータ数)

その後、95%の場合は(標準誤差 * 1.96)の範囲、99%の場合は(標準誤差 * 2.58)の範囲、を算出しています。

※赤白の割合が極端な場合は、上の式では誤差が大きくなります。詳しくは統計の教科書などを参照してください。

タグ:   数学   統計