ベイズモデル構築に役立つ確率分布の確率密度関数、期待値と分散
この記事では、データ解析や予測モデルで利用する確率分布を紹介します。また、それぞれの分布の確率密度関数と、期待値、分散をまとめました。ベイズモデリングなどを行う際に、「この分布ってどういう特徴だっけ?」という確認に役立つ情報をまとめましたので活用してください。
二項分布(Binomial Distribution)
二項分布は、試行を繰り返し、各試行が成功または失敗の2つの結果しか持たない場合に使用される確率分布です。例えば、コインを何回か投げて表が出る回数などが二項分布でモデル化できます。
確率密度関数
$$
{}_n C _k p^k (1-p)^{n-k}
$$
期待値
$$np$$
分散
$$np(1-p)$$
ポアソン分布(Poisson Distribution)
ポアソン分布は、特定の時間間隔または領域内で稀な事象が発生する確率分布です。例えば、一定の時間内に電話がかかってくる回数などがポアソン分布でモデル化できます。待ち行列のモデル化でよく利用されます。
確率密度関数
$$
\frac{\lambda^k}{k!}\cdot e ^{-\lambda}
$$
期待値
$$\lambda$$
分散
$$\lambda$$
幾何分布(Geometric Distribution)
幾何分布は、試行を繰り返し、最初の成功が発生するまでに必要な試行回数をモデル化する確率分布です。例えば、サイコロを振り続けて初めて6が出るまでの試行回数などが幾何分布で表現できます。
確率密度関数
$$
(1-p)^{k-1} p
$$
期待値
$$\frac{1}{p}$$
分散
$$\frac{1-p}{p}$$
ファーストサクセス分布(First-Passage Time Distribution)
ファーストサクセス分布は、ある事象が特定の閾値を初めて超えるまでの時間を表す確率分布です。
確率密度関数
$$
(1-p)^{k} p
$$
期待値
$$\frac{1-p}{p^2}$$
分散
$$\frac{1-p}{p^2}$$
超幾何分布(Hypergeometric Distribution)
超幾何分布は、有限な母集団から非復元抽出を行う場合の確率分布です。例えば、不良品を含む製品ロットからランダムにサンプリングして、特定の数の不良品を選ぶ確率などが超幾何分布でモデル化できます。
確率密度関数
$$ \frac{{}_{K}C_{k} \cdot {}_{N-K}C_{k}}{{}_NC_n} $$
期待値
$$n\frac{K}{N}$$
分散
$$n\frac{K}{N}\frac{N-K}{N}\frac{N-n}{N-1}$$
正規分布(Normal Distribution)
多くのデータ解析や仮説検定に使用される分布です。正規分布(ガウス分布とも呼ばれます)は、連続確率分布の中でも最も一般的なもので、ベルカーブとしても知られています。正規分布は平均値と標準偏差によって特徴付けられ、多くの自然現象や統計的データに適しています。
確率密度関数
$$ \frac{1}{\sqrt{2\pi \sigma ^2}}exp\left( – \frac{(x-\mu)^2}{2\sigma^2} \right) $$
期待値
$$\mu$$
分散
$$\sigma ^2$$