ポアソン分布を学習する前に、相関の強い二項分布についても参照してください。
二項分布
ポアソン分布
ポアソン分布の確率密度関数は以下です。
単位時間あたりに起きる回数を\(\lambda\)、そして確率変数を\(x\)とした時、\(k\)回発生する確率は、
\begin{eqnarray}
P(X=k)
&=& \frac{\lambda^{k}e^{-\lambda}}{k!}
\end{eqnarray}
そして重要なのは、パラメータ\(\lambda\)は単位時間あたりに起きる回数であることです。
「単位時間あたりに平均\(\lambda\)回発生する」場合に、\(x=k\)回発生する確率。
単位時間なので、1時間に平均\(\lambda\)回発生する時、1時間に\(x=k\)回発生する確率がポアソン。
確率密度関数はパラメータが定まった時に、その時\(x=k\)が出る確率です。
なので、取れたデータから単位時間あたりに平均このくらい発生するだろうと推定します。これが\(\lambda\)になり、これでポアソン分布が特定されます。
そしてそのポアソン分布の時に、\(x=k\)が出るのはどのくらいなのかを求めるということになります。
ちなみにポアソン分布の期待値は\(\lambda\)なので、つまり平均が\(\lambda\)。→ 単位時間あたりの平均が\(\lambda\)。
パラメータ\(\lambda\)とは
\(\lambda\)は「単位時間あたりに起きる回数」となるので、滅多に起きない時に使われるポアソン分布ということは\(\lambda\)はかなり小さい数字になるだろうと予測できると思います。
ポアソン分布は以下のような式を定義しています。
\begin{eqnarray}
p=\frac{\lambda}{n}
\end{eqnarray}
いわゆる\(p\)は起きる確率、\(\lambda\)は上でも話した通り単位時間あたりに起きる回数、\(n\)は試行回数です。
試行回数\(n\)を多くしても、\(\lambda\)は単位時間あたりに起きる回数で、滅多に起きないので、かなり小さい。→ 結果\(p\)はかなり小さくなります。
なので、ポアソン分布は滅多に起きない事象、たとえば交通事故や地震発生、隕石が落ちてくる時などの事象を捉える時に使われたりします。
より詳細に
ポアソン分布は滅多に起きない場合の確率密度関数です。
よく題材に上がるのが交通事故の発生確率だったり、さらには隕石が落ちてくる確率とか。
ん?
起きる、起きないを取り扱うということはまさに相反する事象で、ん?二項分布やベルヌーイ分布もそんなようだったような。
そうです!そのため、ポアソン分布は二項分布とはかなり関係のある確率分布となります。
さらに滅多に起きないということは、起きる確率は0にほぼ等しい。起きる確率をpとしたら、pは0にほぼ等しいということになります。
確率変数としては、交通事故が起きる回数、隕石が落ちる回数なので、
二項分布と同じように、試行回数を考えるものです。
ということなので、二項分布の\(p\)を限りなく0に近いことを仮定することで、
ポアソン分布の確率関数を導出することができます。
滅多に起きないのであれば、試行回数もとにかく多く回数こなさないと1回ですら起きないので、その試行回数を\(n\)とした時、\(n\rightarrow∞\)とします。
そして、起きる確率をpとした時、\(p\rightarrow0\)とします。
\(k\)は二項分布の確率関数をそのまま利用して導出しているので、
二項分布の\(k\)と同じ意味で、試行回数\(n\)回のうち、事象が起きた回数を\(k\)としています。
そこで、ある定数パラメータ\(λ\)を置いて、以下の式を考える。
\begin{eqnarray}
p=\frac{\lambda}{n}
\end{eqnarray}
上記のように式を置くと、
\(n\rightarrow∞\)をとると、\(λ\)は定数なので、右辺は0に近づき、左辺も0に近づくので、仮定の\(p\rightarrow0\)を満たします。
さらに、\(p\rightarrow0\)とすると、右辺も0に近づかないといけないので、\(λ\)が定数なので、\(n\)は\(n\rightarrow∞\)を満たさないといけません。
なので、元々の仮定を満たす式を作りました。
この式を二項分布に代入することで、ポアソン分布を導出することができます。
ポアソン分布は二項分布から導出できるので証明してみたいと思います。
\begin{eqnarray}
P(X=k)={}_nC_k p^ k(1-p)^{n-k}
\end{eqnarray}
ここで、\(p= \displaystyle \frac{\lambda}{n}\)と置く。\(\lambda\)はパラメータで定数とします。
そうすると、\(n\rightarrow∞\)とすると、\(\displaystyle \frac{\lambda}{n} \rightarrow 0\)により、\(p\rightarrow0\)になります。
\(p= \displaystyle \frac{\lambda}{n}\)を代入して、
\begin{eqnarray}
P(X=k) &=& {}_nC_k \biggl(\frac{\lambda}{n}\biggl)^ k\biggl(1-\frac{\lambda}{n}\biggl)^{n-k} \\
&=& \frac{n(n-1)(n-2)・・・(n-k-1)}{k!}\biggl(\frac{\lambda}{n}\biggl)^{k} \biggl(1-\frac{\lambda}{n}\biggl)^{n-k} \\
\end{eqnarray}
ここで、分子の各項から\(n\)を抜きます。\(k\)個あるので、\(n \cdot n \cdot \cdot \cdot n = n^{k}\)となり、
\begin{eqnarray}
P(X=k) &=& \frac{n^{k} \cdot 1 \cdot \biggl(1- \displaystyle \frac{1}{n} \biggl) \cdot \biggl(1- \displaystyle \frac{2}{n}\biggl) \cdot \cdot \cdot \biggl(1- \displaystyle \frac{k-1}{n}\biggl)}{k!} \cdot \biggl( \displaystyle \frac{\lambda}{n} \biggl)^{k} \biggl(1- \displaystyle \frac{\lambda}{n} \biggl)^{n-k} \\
&=& \frac{ \biggl(1- \displaystyle \frac{1}{n}\biggl) \cdot \biggl(1- \displaystyle \frac{2}{n}\biggl) \cdot \cdot \cdot \biggl(1- \displaystyle \frac{k-1}{n}\biggl) }{k!} \cdot {\lambda}^{k} \biggl(1- \displaystyle \frac{\lambda}{n} \biggl)^{n-k} \\
&=& \frac{\lambda^{k}}{k!} \cdot \biggl(1- \displaystyle \frac{1}{n} \biggl)\biggl(1- \displaystyle \frac{2}{n}\biggl) \cdot \cdot \cdot \biggl(1- \displaystyle \frac{k-1}{n}\biggl)\biggl(1- \displaystyle \frac{\lambda}{n}\biggl)^{n}\biggl(1- \displaystyle \frac{1}{n}\biggl)^{-k} \\
\end{eqnarray}
ここで\(n\rightarrow∞\)をとると、
\( 1- \displaystyle \frac{1}{n} \rightarrow1\)、\( 1- \displaystyle \frac{2}{n} \rightarrow1\)、\( 1- \displaystyle \frac{k-1}{n} \rightarrow1\)、\( \biggl(1- \displaystyle \frac{1}{n}\biggl)^{-k} \rightarrow1\)で、
\( \biggl(1- \displaystyle \frac{\lambda}{n}\biggl)^{n} \)については、\( \biggl(1- \displaystyle \frac{\lambda}{n}\biggl)^{n} \rightarrow e^{-\lambda} \)になるので、
\begin{eqnarray}
P(X=k) &=& \frac{\lambda^{k}}{k!} \cdot 1 \cdot 1 \cdot \cdot \cdot \cdot 1 \cdot e^{-\lambda} \cdot 1 \\
&=& \frac{\lambda^{k}e^{-\lambda}}{k!}
\end{eqnarray}
ポアソン分布は発生確率がめちゃくちゃ低い場合を想定するので、イメージとしては二項分布での正の確率\(p\)が、
\(p\rightarrow0\)と限りなく0に近い場合を考えるとイメージできれば、簡単です。
ポアソン分布も、二項分布と同じで、2つの事柄を考えます。
ただ二項分布と違うところは、滅多に起きない事柄を扱う点です。
滅多に起きないということは、確率が0にほぼ等しいということです。よくある例としては隕石に当たる確率レベルの滅多に起きない事柄です。
ポアソン分布のモーメント母関数
以下※にて、\(e^{x}\)のマクローリン展開を用いています。
e^{x}
&=& \frac{ {e^{x}}^{(0)} }{0!} + \frac{ {e^{x}}^{(1)} }{1!} + \frac{ {e^{x}}^{(2)} }{2!} + \cdot\cdot\cdot \frac{ {e^{x}}^{(k)} }{k!} + \cdot\cdot\cdot \\
\end{eqnarray}
\begin{eqnarray}
M(t)
&=& E[e^{tx}] \\
&=& \sum_{x=0}^{\infty} e^{tx}\cdot P(X=x) \\
&=& \sum_{x=0}^{\infty} e^{tx}\cdot \frac{\lambda^{x} e^{-\lambda}}{x!} \\
&=& e^{-\lambda} \sum_{x=0}^{\infty} \frac{\lambda^{x} e^{tx}}{x!} \\
&=& e^{-\lambda} \sum_{x=0}^{\infty} \frac{ (\lambda e^{t})^{x}}{x!} \\
&=& e^{-\lambda} \cdot e^{\lambda e^{t}} ・・・(※)\\
&=& e^{\lambda e^{t} -\lambda} \\
&=& e^{( \lambda (e^{t} -1) )} \\
\end{eqnarray}
ポアソン分布の期待値
\begin{eqnarray}
M^{'}(t)
&=& ( \lambda (e^{t} -1) )^{'} e^{( \lambda (e^{t} -1) )} \\
&=& \lambda e^{t} e^{( \lambda (e^{t} -1) )} \\
\end{eqnarray}
\begin{eqnarray}
E[X]
&=& M^{'}(0)
&=& \lambda e^{0} e^{( \lambda (e^{0} -1) )} \\
&=& \lambda e^{0} \\
&=& \lambda \\
\end{eqnarray}
ポアソン分布の分散
\begin{eqnarray}
M^{''}(t)
&=& \frac{d}{dt} M^{'}(t) \\
&=& \lambda e^{t} \cdot e^{( \lambda (e^{t} -1) )} + \lambda e^{t} \cdot \lambda e^{t} e^{( \lambda (e^{t} -1) )} \\
&=& \lambda e^{t} \cdot e^{( \lambda (e^{t} -1) )} + \lambda^{2} e^{2t} e^{( \lambda (e^{t} -1) )} \\
&=& (\lambda e^{t} + \lambda^{2} e^{2t}) e^{( \lambda (e^{t} -1) )} \\
\end{eqnarray}
\begin{eqnarray}
M^{''}(0)
&=& (\lambda e^{0} + \lambda^{2} e^{0}) e^{( \lambda (e^{0} -1) )} \\
&=& (\lambda + \lambda^{2}) e^{0} \\
&=& \lambda + \lambda^{2} \\
\end{eqnarray}
したがって、
\begin{eqnarray}
V(X)
&=& E[X^{2}] - \{E[X]\}^{2} \\
&=& M^{'}(0) - M^{''}(0) \\
&=& (\lambda + \lambda^{2}) - \lambda^{2} \\
&=& \lambda
\end{eqnarray}