離散分布である、ポアソン分布。
連続分布である、指数分布とガンマ分布。
これらは実は深い関係性があります。
ここでは、そんな関係性について考えて、密度関数が複雑なこの3つの分布についてより覚えやすくなるため、そして苦手意識をなくすために、まとめていきましょう!
ポアソン・指数・ガンマ分布にあるパラメータについて
ガンマ分布は指数分布やポアソン分布と関係性があります。
ガンマ分布はポアソン分布から導出され、そして指数分布はガンマ分布から生成されます。
ここでは詳細は省きますが、それぞれ共通にあるパラメータの\(\lambda\)を考えると、
分布 | 分布の説明 |
---|---|
ポアソン分布 | 単位時間あたりに平均\(\lambda\)回発生する分布 |
指数分布 | \(\lambda\)時間あたりに1回発生する分布 |
ガンマ分布 | \(\lambda\)時間あたりに\(n\)回発生する分布 |
です。
ポイントとしては、
ポアソン分布は、単位時間あたりを基準としてパラメータ設定しています。
指数分布やガンマ分布は、等間隔の時間で\(\lambda\)時間あたりを基準としてパラメータ設定しています。
なので、ポアソン分布は回数を\(\lambda\)とし、指数分布やガンマ分布は等間隔の時間を\(\lambda\)と指定していることがポイントです。
ガンマ分布
ガンマ分布は「\(\lambda\)時間あたりに\(n\)回発生する分布」でした。
これは分布でどう表されるか?
\(\alpha\)を\(\alpha = n\)、\(\beta\)を\(\beta = \lambda \)とした、\(\Gamma(n, \lambda)\)となります。
確率密度関数は、
\begin{eqnarray}
f(x|n,\lambda)
&=& \frac{\lambda^{n}}{\Gamma(n)}x^{n-1}\exp(-\lambda x) (x \geq 0) \\
\end{eqnarray}
指数分布
指数分布は「\(\lambda\)時間あたりに1回発生する分布」でした。
なので、\(\alpha\)を\(\alpha = 1 \)、\(\beta\)を\(\beta = \lambda\)とした、\(\Gamma(1, \lambda)\)となります。
確率密度関数は、
\begin{eqnarray}
f(x|1,\lambda)
&=& \frac{\lambda}{\Gamma(1)}x^{1-1}\exp(-\lambda x) \\
&=& \lambda\exp(-\lambda x) (x \geq 0) \\
\end{eqnarray}
ここでよくある指数分布の形にするために、\(\lambda = 1\)とすると、
\begin{eqnarray}
f(x)
&=& \exp(-x) (x \geq 0) \\
\end{eqnarray}
となり、これは「単位時間あたりに1回発生する分布」となります。
ガンマ分布の導出
ガンマ分布はポアソン分布から導出されるのですが、どうやって導出されるのでしょうか?
改めて、
ガンマ分布:\(\lambda\)時間あたりに\(n\)回発生する分布
です。
ポアソン分布は、1時間あたりに平均\(\lambda\)回発生するということは、
\(\lambda\)時間で1回発生すると言い換えることができますね!これはまさに指数分布です。すなわち、ポアソン分布をこう考えることで指数分布が導けるということになります。
そして、\(\lambda\)時間で1回発生をn回発生と考えれば、ガンマ分布になります。
指数分布とガンマ分布
スタートラインとして、ポアソン分布から指数分布、ガンマ分布と導出していくので、
ポアソン分布を以下として仮定します。
\begin{eqnarray}
f(x|\lambda)
&=& \frac{\lambda^{x} e^{-\lambda x}}{x!}
\end{eqnarray}
\(\lambda\)回と仮定したときの分布で、この時に\(x=k\)回発生する確率である。
ポアソン分布で単位時間あたりに\(\lambda\)回出る時に、1回発生したとします。この時始まった時から、1回発生までの時間を\(T_{1}\)とします。
そして、これは、時間\(T_{1}\)経つ中で1回発生したということが言えます。(指数分布は\(\lambda\)時間あたりに1回発生した時の確率分布であるので、うまく言い換えることができてますね。)
この考え方を用いて計算をしてみます。
ポアソン分布では、\(\lambda\)とした上で、その分布の時に、\(N_{t}\)回出る確率なので、
あくまで1回だけ発生した場合と想定して考えると、時間が\(T_{1}\)以上で\(t\)時間経過している時、\(t\)時間経過してる時に発生していた回数を\(N_{t}\)とすると、最低1回は発生しているので、
\begin{eqnarray}
F(t)
&=& P(T_{1} \leq t) \\
&=& P(N_{t} \geq 1) \\
&=& 1 - P(N_{t} = 0) \\
&=& 1 - \frac{\lambda^{0} e^{-\lambda t}}{0!} \\
&=& 1 - e^{-\lambda t} \\
\end{eqnarray}
\begin{eqnarray}
f(t)
&=& \frac{d}{dt}F(t) \\
&=& \lambda e^{-\lambda t}
\end{eqnarray}
これは指数分布になります。
上ではあくまで1回発生を仮定したので、これをn回発生として考えてみても同様で、
途中でマクローリン展開で、
\begin{eqnarray}
F(t)
&=& P(T_{n} \leq t) \\
&=& P(N_{t} \geq n) \\
&=& 1 - ( P(N_{t} = 0) + P(N_{t} = 1) + P(N_{t} = 2) + \cdot\cdot\cdot + P(N_{t} = n-1) ) \\
&=& 1 - \bigl(\frac{\lambda^{0} e^{-\lambda t}}{0!} + \frac{\lambda^{1} e^{-\lambda t}}{1!} + \frac{\lambda^{2} e^{-\lambda t}}{2!} + \cdot\cdot\cdot + \frac{\lambda^{n-1} e^{-\lambda t}}{(n-1)!} \bigr) \\
&=& 1 - \bigl(e^{-\lambda t} + \lambda e^{-\lambda t} + \frac{\lambda^{2}e^{-\lambda t}}{2!} + \cdot\cdot\cdot + \frac{\lambda^{n-1}e^{-\lambda t}}{(n-1)!} \bigr) \\
&=& 1 - \bigle^{-\lambda t} + \lambda e^{-\lambda t} + \frac{\lambda^{2}e^{-\lambda t}}{2!} + \cdot\cdot\cdot + \frac{\lambda^{n-1}e^{-\lambda t}}{(n-1)!} \bigr) \\
\end{eqnarray}