チェビシェフの不等式を証明してみる | 確率論の重要概念を理解しよう
この記事では、チェビシェフの不等式を実際に証明してみます。この不等式は、確率論における基本的かつ重要な概念であり、データの分散や標準偏差に基づく誤差範囲に関するものです。ここでは、マルコフ不等式を証明し、そこからチェビシェフの不等式を証明する手順を踏んで、この式を証明してみました。
チェビシェフの不等式
チェビシェフの不等式とは、以下のような不等式になります。式では、確率変数$X$の平均値を$\mu$、標準偏差を$\sigma$、任意の定数を$k$と表しています。
$$
P\left(|X-\mu|\geq k\sigma \right) \leq \frac{1}{k^2}
$$
この不等式の重要なポイントは、確率変数がどのような分布に従っているかに関係なく、確率変数が平均から一定の距離以上離れる確率が制限されていることです。
これは実際の応用に非常に役立ちます。たとえば、統計的なデータ解析を行う際に、データの平均と標準偏差を用いて、データのばらつきや外れ値の評価を行うことができます。
特に、チェビシェフの不等式は正規分布など特定の分布に依存しないため、幅広い場面で使用できます。
本記事では、この不等式を証明してみます。
マルコフの不等式の証明
チェビシェフの不等式の証明は、マルコフの不等式を利用する方が楽なので、ここではマルコフの不等式の証明→チェビシェフの不等式の証明という手順で行っていきたいと思います。
マルコフの不等式は、以下のようなものにります。なお、$X$は非負の確率変数とします。
$$
P\left(X \geq C\right) \leq \frac{E[X]}{C}
$$
Cは任意の定数になります。確率変数Xの確率密度関数を$f(x)$とすると、期待値は以下の式で表すことができます。
$$
E[X] = \int_0^{\infty}xf(x)dx
$$
これをCで2つの区間に区切って考えると、
$$
E[X] = \int_0^Cxf(x)dx + \int_C^{\infty}xf(x)dx
$$
$\int_0^Cxf(x)dx$を消去すると上の等式は$\int_0^Cxf(x)dx$も$\int_C^{\infty}xf(x)dx$も0以上なので、以下のようになります。
$$
E[X] \geq \int_C^{\infty}xf(x)dx
$$
さらに、上式でx=Cとおくと、もともとXは$[c, \infty]$だったので、
$$
E[X] \geq \int_C^{\infty}xf(x)dx \geq C\int_C^{\infty}f(x)dx
$$
となります、ここまで来れば式を単純に変形して、
$$
P\left(X \geq C\right) = \int_C^{\infty}f(x)dx = \frac{E[X]}{C}
$$
を導くことができます。以上で、マルコフの不等式の証明は終わりです。
チェビシェフの不等式の証明
マルコフの不等式で、$X = (Y-\mu)^2$、$C = k^2 \sigma ^2$と置きます。
すると、式は、
$$
P\left((Y-\mu)^2 \geq k^2 \sigma ^2\right) \leq \frac{E[(Y-\mu)^2]}{ k^2 \sigma ^2}
$$
となります、ここで、$E[(Y-\mu)^2]=\sigma^2$なので、
$$
P\left((Y-\mu)^2 \geq k^2 \sigma ^2\right) \leq \frac{1}{k^2}
$$
2乗を絶対値に注意して展開すると、
$$
P\left(|Y-\mu| \geq k \sigma \right) \leq \frac{1}{k^2}
$$
となります。確率変数Yは任意の変数なのでXに書き換えると、
$$
P\left(|X-\mu| \geq k \sigma \right) \leq \frac{1}{k^2}
$$
となり、チェビシェフの不等式が証明できました。
他の証明方法もありますが、この方法が楽だと思います