ここでは、離散の確率分布である「超幾何分布」についてまとめていこうと思います。
超幾何分布は、他の離散分布とは違い、非復元性があります。
そういった特徴も含めて、ここでは超幾何分布の導出から期待値、分散まで取り扱おうと思います。
超幾何分布
超幾何分布とは、二項分布に近いですが、「」を言います。
二項分布との違いは元に戻さない非復元になります。
二項分布は1回出たものは、再度出しても良く(復元)、
超幾何分布は1回出たものは、元に戻さないのでもう出てこない(非復元)ということです。
超幾何分布は以下のような式になります。
\begin{eqnarray}
P(X=x)= \frac{ {}_MC_x {}_{N-M}C_{n-x} }{ {}_NC_n}
\end{eqnarray}
この式の導出について、考えてみます。
超幾何分布の導出
全部で\(N\)個あって、そのうち\(M\)個が不良品だとします。
そうすると、良品は全部で\(N-M\)個あるとなります。
今回は不良品が何個入っているかが確率変数なので\(x\)とします。
そして今回はこの\(N\)個のうち\(n\)個をランダムに取りたいと思います。
まず不良品\(x\)個出てくるとすると、どの不良品が出るかは区別しない(不良品1つ1つに番号を振っていき、1番が出たらとかは考えず、全てただ不良品として扱う。区別するとなった場合、取り出したものが例えば1である必要があるなら、不良品の中でも引いたものが1である場合も考えないといけない)ので、純粋に全部で\(M\)個の不良品から\(x\)個を取るので、\({}_MC_x\)。
そして今\(x\)個をとったので、残りは\(n-x\)個を良品の\(N-M\)個から取ることになります。なので、\({}_{N-M}C_{n-x}\)。
そして全部で\(N\)個からn個を取るので、全部で\({}_NC_n\)通り。
よって、
\begin{eqnarray}
P(X=x)= \frac{ {}_MC_x {}_{N-M}C_{n-x} }{ {}_NC_n}
\end{eqnarray}