確率・統計
記事内に商品プロモーションを含む場合があります

分散と平均の計算

確率・統計関連記事
Aru

ここで計算するのは以下の式になります。

覚えておきたい期待値と分散の式

$$ \begin{eqnarray} E[X] &=& \sum_{i=0}^{n}{x_i P_i} = \mu \\ V[X] &=& E\left[(X – u)^2\right] = \sigma ^2\\ E[aX] &=& aE[X]\\ V[aX] &=& a^2V[X]\\ C[X,Y] &=& E[XY] – E[X]E[Y]\\ V[X+Y] &=& V[X] + V[Y] + 2C[X, Y]\\ \end{eqnarray} $$

1変数の期待値と分散

期待値E[X]と分散V[X]

確率変数が$P_i=P(X=x_i) (i = 1 ,2,… n)$の場合、期待値$E[X]$と分散$V[X]$はそれぞれ以下のようになります。

$$ \begin{eqnarray} E[X] &=& \sum_{i=0}^{n}{x_i P_i} = \mu \\ V[X] &=& E\left[(X – u)^2\right] = \sigma ^2\\ \end{eqnarray} $$

上の式は、期待値と分散の定義になります。

a倍した場合の期待値

次に、a倍した場合の期待値$E[aX]$と、分散$V[aX]$を計算してみます。

期待値は定義より以下になります。

$$ E[aX] = \sum_{i=0}^{n}{ax_i P_i} $$

ここで、aは定数なので外に出すことができて、結果以下の式になります。

$$ E[aX] = a\sum_{i=0}^{n}{x_i P_i} = aE[X] $$

このように期待値$E[aX]$は、$E[X]$を単純に$a$倍したものになります。

a倍した場合の分散

分散$V[aX]$も同様に定義から計算してみます。

$$ \begin{eqnarray}
V[aX] &=& E\left[(aX – a\mu)^2\right]\\
&=& E\left[ a^2(X-\mu)^2\right]\\
\end{eqnarray}

ここで、$E[aX] = aE[X]$を使うと、以下のようになります。

$$ \begin{eqnarray}
V[aX] &=& a^2 E\left[(X – u)^2\right] \\
&=& a^2 V[X] \end{eqnarray} $$

つまり$V[aX]$は、$V[X]$を$a^2$倍した値になります。

2変数の期待値と分散、共分散

2変数の場合の期待値と分散、共分散

確率変数が$P_{ij}=P(X=x_i, Y=y_1) (i = 1 ,2,…, n, j = 1,2,…,m)$の場合、期待値$E[X]$,$E[Y]$と分散$V[X]$,$V[Y]$はそれぞれ以下のようになリマス。

なお、$X$の周辺確率と$Y$の周辺確率を、それぞれ$P_i=P_X(x_i)$、$P_j=P_Y(y_j)$と表すと、以下のようになります。

$$ \begin{eqnarray} E[X] &=& \sum_{i=0}^n {x_i P_X(x_i)} &=& \sum_{i=0}^n x_i \sum_{j=0}^m P_{ij} &=& \sum_{i=0}^n\sum_{j=0}^m x_i P_{ij} = \mu_x\\ E[Y] &=& \sum_{j=0}^m {y_i P_Y(y_i)} &=& \sum_{j=0}^m y_i \sum_{i=0}^n P_{ij} &=& \sum_{i=0}^n\sum_{j=0}^m y_i P_{ij} = \mu_y\\ V[X] &=& E\left[ (X – \mu_x)^2\right] \\ V[Y] &=& E\left[ (Y – \mu_y)^2\right] \\ \end{eqnarray} $$

次に共分散$C[X,Y]$。定義から、

$$ \begin{eqnarray} C[X,Y] &=& E\left[ (X – \mu_x)(Y – \mu_y)\right]\\ &=& E\left[ XY – \mu_y X – \mu_x Y + \mu_x \mu_y \right]\\ &=& E[XY] – \mu_y E[X] – \mu_x E[Y] + \mu_x \mu_y \\ &&※\mu_x = E[X], \mu_y = E[Y]なので、\\ &=& E[XY] – E[Y]E[X] – E[X]E[Y] + E[X]E[Y]\\ &=& E[XY] – E[X]E[Y] \end{eqnarray} $$

V[X+Y]を計算

次に、$V[X+Y]$を求めてみます。

$$ \begin{eqnarray} V[X+Y] &=& E\left[\left((X+Y) – (\mu_x+\mu_y)\right)^2 \right]\\ &=& E\left[ \left( (X-\mu_x) + (Y-\mu_y)\right)^2 \right]\\ &=& E\left[ (X-\mu_x)^2 + 2(X-\mu_x)(Y-\mu_y) + (Y – \mu_y)^2\right]\\ &=& E\left[(X-\mu_x)^2\right] + E\left[(Y-\mu_y)^2\right] + 2E\left[(X-\mu_x)(Y-\mu_y)\right]\\ &=& V[X] + V[Y] + 2C[X,Y] \end{eqnarray} $$

X,Yが独立の場合

X,Yが独立の場合は、$P_{XY}(x,y)=P_X(x)P_Y(y)$が成り立つので、共分散$C[X,Y]$は、

$$ \begin{eqnarray} C[X,Y] &=& E[XY] – E[X]E[Y]\\ &=& \sum_{i=0}^n \sum_{j=0}^m x_i y_i P_{XY}(i,j) – E[X]E[Y] \\ &=& \sum_{i=0}^n \sum_{j=0}^m x_i y_i P_X(i) P_Y(j) – E[X]E[Y] \\ &=& \sum_{i=0}^n x_i P_X(i) \sum_{j=0}^m y_i P_Y(j) – E[X]E[Y] \\ && ※\sum_{i=0}^n x_i P_X(i) = E[X], \sum_{j=0}^m y_i P_Y(j) =E[Y]なので、\\ &=& E[X]E[Y] – E[X]E[Y] = 0 \end{eqnarray} $$

共分散が0になるので、

$$ \begin{eqnarray} V[X+Y] &=& V[X] + V[Y] + 2C[X,Y] \\ &=& V[X] + V[Y] + 0 \\ &=& V[X] + V[Y] \end{eqnarray} $$

独立の場合の分散の足し算の式は、結構利用頻度が多いので要チェックです。

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

ABOUT ME
ある/Aru
ある/Aru
IT&機械学習エンジニア/ファイナンシャルプランナー(CFP®)
専門分野は並列処理・画像処理・機械学習・ディープラーニング。プログラミング言語はC, C++, Go, Pythonを中心として色々利用。現在は、Kaggle, 競プロなどをしながら悠々自適に活動中
記事URLをコピーしました