統計学

多項分布の導出

2022年6月29日

多項分布

多項分布の導出

N個の球が入った袋の中に3種類の赤球\(x_{1}\)個、青球\(x_{2}\)個、緑球\(x_{3}\)個がいくつか入っているとします。
その中から復元抽出で独立に\(x\)個回取り出し、
その組み合わせとなる確率を求めます。
 

まず、復元抽出なので、毎回同じ確率で赤玉、青玉、緑球が出てきます。
そのため1回の取り出し試行で
赤玉が出る確率は、\(\frac{x_{1}}{N}\)
青玉が出る確率は、\(\frac{x_{2}}{N}\)
緑玉が出る確率は、\(\frac{x_{3}}{N}\)
です。
 

そして試行をしていきます。\(n\)回試行をしていき、
赤玉は、\(x_{r}\)個
青玉は、\(x_{b}\)個
緑球は、\(x_{g}\)個
出たとします。
そしてこの時、\(n=x_{r}+x_{b}+x_{g}\)です。
 

まずこれらの連続の取り出し試行は1つの確率を出す中での1連なので同時に起きると考えることができます。
なので、今回赤玉の出る確率が\(\frac{x_{1}}{N}\)で、赤玉は\(x_{r}\)回出たので、掛け算により、赤玉だけを見た時赤玉が出た確率全体は\( (\frac{x_{1}}{N})^{x_{r}} \)
同様に、青玉は\( (\frac{x_{2}}{N})^{x_{b}} \)、緑球は\( (\frac{x_{3}}{N})^{x_{g}} \)。
 

そして次に、試行をしていくと赤や青、緑の回数が出たとしても、それは1通りとは限らないので、その出る組み合わせの順番を考える必要があります。
まず\(n\)個取り出したうち、赤球がでた順番を考えます。なので組み合わせは\({}_nC_{x_{r}}\)。
そして残りの\( n-x_{r} \)回に対して、青球が出た順番を考えます。組み合わせは\({}_{n-x_{r}}C_{x_{b}}\)。
そして残りの\( n-x_{r}-x_{b} \)回に対して、つまり\( x_{g} \)回に対して、緑が出た順番を考えますが、残りが\( x_{g} \)回なので1通りになります。
 

よってこの順番決めも同時に起こるため、掛け算により、
\(n\)個取り出したうち、赤、青、緑の出る順番の組み合わせは、
$$
{}_nC_{x_{r}}\cdot{}_{n-x_{r}}C_{x_{b}}\cdot1
$$
通り。
 

よってこれら、赤玉が出る、青玉が出る、緑球が出るのは同時なので、掛け算により、
\begin{eqnarray}
P(x_{1}=x_{r} ,x_{2}=x_{b} ,x_{3}=x_{g} )= {}_nC_{x_{r}}\cdot{}_{n-x_{r}}C_{x_{b}}\cdot1(\frac{x_{1}}{N})^{x_{r}}(\frac{x_{2}}{N})^{x_{b}}(\frac{x_{3}}{N})^{x_{g}}
\end{eqnarray}
 

こう見るとわからないですね笑
なので、具体的な数値で確率分布を求めてみましょう!
 

具体的な数値で、多項分布を導出

10個の球が入った袋があり、その中に赤球が3個、青球が2個、緑球が5個入っているとします。
そして復元抽出(毎回袋から取り出して、何色の球かを確認したあと袋に戻すので、試行するときは常に10個入ってる)で、独立とします。
 

まず1回の試行で赤が出る確率は0.3、青は0.2、緑は0.5です。
そして、試行を繰り返し行なっていき、7回試行したとします。
以下の結果が得られたとします。
1回目:赤、2回目:緑、3回目:赤、4回目:青、5回目:青、6回目:緑、7回目:緑
これらは同時に出るので、確率は掛け算して
0.3*0.5*0.3*0.2*0.2*0.5*0.5
となります。
まとめると、\( 0.3^{2} \cdot 0.2^{2} \cdot 0.5^{3} \)となり、それぞれの色の出る確率に対して出た数だけ掛けているのがわかります。
 

ここで、赤が出た回数を\(x_{r}\)回、青が出た回数を\(x_{b}\)回、緑が出た回数を\(x_{g}\)回とすると、\( 0.3^{x_{r}} \cdot 0.2^{x_{b}} \cdot 0.5^{x_{g}} \)になります。
 

次に出る順番を考えます。
上では、ある7回の試行の結果がありますが、赤が2回、青が2回、緑が3回でて、その出る順番を考えます。試行7回のうちまず赤が出る場所(番目)を2つ選ぶので、\({}_7C_2\)。次に残りの5つの場所(番目)から青が出る2つを選ぶので、\({}_5C_2\)。そして最後のこり3つの場所から緑が出る3つを選ぶが、その場所に3つ入れるだけなので1通り。
よって、7回やって赤が2回、青が2回、緑が3回が出る場合の組み合わせは\({}_7C_2 \cdot {}_5C_2\)通り。
 

ここで、7回試行して、赤が出た回数を\(x_{r}\)回、青が出た回数を\(x_{b}\)回、緑が出た回数を\(x_{g}\)回とすると、\({}_7C_{x_{r}} \cdot {}_5C_{x_{b}}\)通り。
 

以上のことから、
\begin{eqnarray}
P(x_{r} ,x_{b} ,x_{g} )= {}_7C_{x_{r}}\cdot{}_5C_{x_{b}}\cdot0.3^{x_{r}}\cdot0.2^{x_{b}}\cdot0.5^{x_{g}}
\end{eqnarray}

多項分布は式を覚えるよりも、上記のように考えて導出した方がいいですね!

-統計学
-

© 2022 Yosshi Blog Powered by AFFINGER5