ポアソン分布、幾何分布、指数分布、ガンマ分布これらは様々な関係があります。
ポアソン分布の導出方法としては、
よくあるのは二項分布から、ラムダを固定して試行回数nを無限に増やしていけば、原理的には滅多に起きないことというように表現でき、確率pが小さくなる。これでポアソン分布を導く方法。(仮定からpが小さくなることを言っていて、その場合に導かれた分布はまさに確率が低い時に適用できる分布となり、それがポアソン分布になる。)
もう1つの方法は、ポアソン過程。
分布 | 説明 |
---|---|
ポアソン分布 | ある期間において平均\(\lambda\)回発生すると仮定した場合の確率分布 |
幾何分布 | 1回イベント発生するのにかかった試行回数の分布 |
指数分布 | ある期間において平均\(\lambda\)回発生すると仮定した場合において、1回イベント発生するのにかかった時間\(x\)の確率分布 |
ガンマ分布 | ある期間において平均\(\lambda\)回発生すると仮定した場合において、\(k\)回イベント発生するのにかかった時間\(x\)の確率分布 |
分布 | 密度関数 |
---|---|
ポアソン分布 | \(f(x) = \displaystyle \frac{e^{-\lambda} \lambda^{x}}{x!} \) |
幾何分布 | \(f(x) = p^{x}(1-p) \) |
指数分布 | \(f(x) = \lambda e^{-\lambda x} \) |
ガンマ分布 | \(f(x) = \displaystyle \frac{\lambda^{k}}{\Gamma(k)}x^{k-1}e^{-\lambda x} \) |
ガンマ分布から指数分布の導出
なので、まず指数分布はガンマ分布の説明文を見比べると、違う部分は指数分布の「1回イベント」ガンマ分布の「\(k\)回イベント」なので、指数分布はガンマ分布で\(k = 1\)としたものになります。
実際に計算してみると、\(\Gamma(1) = 1\)であることから、
\begin{eqnarray}
f(x)
&=& \frac{\lambda^{1}}{\Gamma(1)}x^{1-1}e^{-\lambda x} \\
&=& \frac{\lambda}{1}x^{0}e^{-\lambda x} \\
&=& \lambda e^{-\lambda x}
\end{eqnarray}
となり、指数分布になりました。
ポアソン分布の導出
ポアソン分布についてはいくつか導出方法があります。
- \(①\) 二項分布からの導出
- \(②\) ポアソン過程からの導出
\(①\) 二項分布からの導出
こちらについては、以下の記事で扱っているので、ぜひご覧ください!
二項分布からのポアソン分布導出
今回は、下の\(②\)にてポアソン過程を使ったポアソン分布の導出について説明します!
\(②\) ポアソン過程からの導出
次にこれらの分布について、図を書いて考えてみます。
ここで、\(k\)回目のイベントが発生した時間を\(T_{k} (k \neq 0)\)とします。
例えば初めてのイベントが発生した時間は1回目になるので、\(T_{1}\)
2回目に発生したイベントの時間は、\(T_{2}\)
となります。
例外として最初の時間は\(T_{0} = 0\)とします。
このとき何が言えるかというと、以下のように期間を切れば、初めてのイベント発生を作ることができます。
以下のように点線で期間を区切ってみたいと思います。
\(T_{0}\)から\(T_{1}\)までを1つの期間と見れば、\(T_{0}\)から時間がスタートしたとした時、初めてイベントが発生するのが\(T_{1}\)になるので、つまり経過時間は\(T_{1} - T_{0}\)になります。
\(T_{1}\)から\(T_{2}\)までを1つの期間と見れば、\(T_{1}\)から時間がスタートしたとした時、初めてイベントが発生するのが\(T_{2}\)になるので、つまり経過時間は\(T_{2} - T_{1}\)になります。
これはとても重要なポイントで、期間を区切れば、初めてイベントが発生するまでの分布を構築することができるということである。
初めてイベントが発生するまでの時間分布といえば、そうですね!指数分布です!
期間ごとに指数分布に従っているということになります。
1つ目の期間では、確率変数\(T_{1} - T_{0}\)は指数分布に従っていて、確率変数\(T_{2} - T_{1}\)についても指数分布に従っていて、....、繰り返して、確率変数\(T_{k} - T_{k-1}\)も指数分布に従っているということになります。
そして上記の分布は同時に起きるので、積で分布を構築することも可能です。
ココがポイント
ポアソン過程では、回数と経過時間にそれぞれ着目して、回数に着目した時の経過時間と、経過時間に着目した時の回数をそれぞれ視覚的に捉えるようにする。
ここからポアソン過程について説明していきます。
過程なので、時間を確率変数とします。
なので、確率変数\(W_{k} = T_{k} - T_{k-1}\)とおきます。
そうすると確率変数\(W_{k}\)は平均\(\lambda\)の指数分布に従うので、
\begin{eqnarray}
f(W_{k}) &=& \lambda e^{-\lambda W_{k}}
\end{eqnarray}
と表現できます。
ここで1つ問題があります。
ポアソン分布を導出したいが、指数分布とポアソン分布の確率変数は一致していません。
平均の\(\lambda\)は一致していますが、指数分布は経過時間を確率変数にしているのに対して、ポアソン分布は回数を確率変数としています。
なので、経過時間をうまくポアソン分布で扱えるように回数に変換するような処理が必要になります。
上の図を経過時間視点で見るのではなく回数視点で見てみます。
発生した回数を\(k\)回とすると、その発生時間は\(T_{k}-T_{k-1}\)の間で発生していることになります。
\(T_{k-1}\)は\(k-1\)回が発生した時間を含んでいるので、これを引くことで、\(T_{k}-T_{k-1}\)の中で\(k\)回目が発生しているということになります。
そして今\(\lambda\)回を平均としてみている中で、\(k\)回目発生するまでの時間分布と\(k-1\)回発生するまでの時間分布を引けば、その中に1回発生します。
この\(k\)回目発生するまでの時間分布や\(k-1\)回目発生するまでの時間分布は、ガンマ分布に従います!!
なので、この2つの分布を引いたものがポアソン分布になるということになります。
ポアソン分布
ポアソン分布は回数が確率変数となるので、ポアソン分布をPとした時、
そして指数分布の平均1回を仮定しておらず、ポアソン分布では平均\(lambda\)回を仮定しているので、
平均\(\lambda\)回でかつ、1回の発生を考えるのは、ガンマ分布となるので、ガンマ分布を用いて、
\begin{eqnarray}
P(N_{t} = k)
&=& P(T_{k} < t, T_{k+1} > t) \\
&=& P(T_{k} < t) - (T_{k+1} < t) \\
&=& \int_{0}^{t} \frac{\lambda^{k}}{(k-1)!}x^{k-1}\exp^{-\lambda x}dx - \int_{0}^{t} \frac{\lambda^{k+1}}{(k)!}x^{k}\exp^{-\lambda x}dx \\
&=& \Bigr[\frac{\lambda^{k}}{k!} x^{k} \exp^{-\lambda x}\Bigr]_{0}^{t} \\
&=& \displaystyle \exp^{-\lambda t}\frac{(\lambda t)^{k}}{k!} \\
\end{eqnarray}
とポアソン分布を導出することができる。