離散型の2変数の確率分布
ここでは、以下について説明します。2変数以上の確率分布になると、このあたりの用語が出てきますので用語の意味などを確認しておきましょう。
- 周辺確率分布
- 同時確率
離散型同時確率分布
例えば、1枚のコインと1個のサイコロを同時に1回投げたとき、コインについて表がでれば$X=1$、裏が出れば$X=2$とし、サイコロの出た目を$Y$とする場合について考えます。
このとき$P(X = x_i, Y = y_i)$は次の表のようになります。
x\y | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
---|---|---|---|---|---|---|---|
1 | 1/12 | 1/12 | 1/12 | 1/12 | 1/12 | 1/12 | 1/2 |
2 | 1/12 | 1/12 | 1/12 | 1/12 | 1/12 | 1/12 | 1/2 |
合計 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1 |
この、$ P(X = x_i, Y = y_i)=P_{ij} $を同時確率と呼びます。
同時確率では、よく「Xの周辺確率分布を求めなさい」、とか、「Yの周辺確率分布を求めなさい」とかいう設問があります。
数式で書くと以下のようになり、複雑です。
Xの周辺確率分布
$$ P_x(x_i) = \sum_{j=1}^{n}P_{ij} $$
Yの周辺確率分布
$$ P_y(y_i) = \sum_{i=1}^{n}P_{ij} $$
なんだか難しそうな言葉ですが、上の表で言えば横の合計(水色の部分)と、縦の合計(緑色の部分)を求めているに他なりません。
表の横方向の合計がXの周辺確率分布で、縦方向の合計がYの周辺確率分布になります。
上の例は、XとYが独立なので表は簡単ですが、例えば、Xがサイコロの目が偶数・奇数で、Yが6の目が出る・出ないなど、独立でない場合は、表はすこし複雑になります。
普通は、コインの表が出たからといって、サイコロの目の出やすさが変わることはありません。このようにそれぞれが関係を持たないものを独立といいます。
一方、1つのサイコロで、「偶数の目がでる・奇数の目が出る」、「6の目がでる・でない」には、関係があります。例えば、奇数の場合は、サイコロの目が6(偶数)であることはありません。こういう場合は、XとYは独立な関係でないことになります