Blog Article

条件付き確率

概要

条件付き確率について簡単に述べると、
2つの事象A,Bがあったとき、Aが起こったという条件の下でBが起こる確率
である。本記事では条件付き確率を出発点に、Bayesの定理、事象の独立性について触れる。

条件付き確率

2つの事象AとBがあって、Aが起こったという条件下でBが起こる確率は

P(BA)=P(AB)P(A)(1)P(B \mid A) = \frac{P(A \cap B)}{P(A)} \cdots (1)

ただし、P(A)>0P(A) \gt 0
これが、Aを与えたときのBの条件付き確率という。
(1)(1)の分母を払うと P(AB)=P(BA)P(A)P(A \cap B) = P(B | A) P(A)
同様に、P(B)>0P(B) \gt 0のとき
P(AB)=P(AB)P(B)P(A \cap B) = P(A | B) P(B)

更に、事象A1,...,AnA_{1},...,A_{n}に対して、P(A1An)>0P(A_{1} \cap \cdots A_{n}) \gt 0のとき、
前述の式変形を適用して
P(A1An)=P(AnA1An1)P(A1An1)P(A_{1} \cap \cdots \cap A_{n}) = P(A_{n} \mid A_{1} \cap \cdots \cap A_{n-1} ) P(A_{1} \cap \cdots \cap A_{n-1} )
=P(AnA1An1)××P(A3A1A2)×P(A2P1)P1(2) = P(A_{n} \mid A_{1} \cap \cdots \cap A_{n-1} ) \times \cdots \times P(A_{3} \mid A_{1} \cap A_{2}) \times P(A_{2} \mid P_{1})P_{1} \cdots (2)

命題1:全確率の公式

B1,B2,B_{1}, B_{2}, \dotsを互いに排反な事象の列とし
P(Bk)>0,k=1Bk=ΩP(B_{k}) \gt 0, \bigcup_{k=1}^{\infty}B_{k} = \Omega
を満たすとき、事象Aの確率は、次のように分解できる。

P(A)=k=1P(ABk)P(Bk)P(A) = \sum_{k=1}^{\infty} P(A \mid B_{k})P(B_{k})

証明

A=A(k=1Bk)=k=1(ABk) A = A \cap (\bigcup_{k=1}^{\infty} B_{k}) = \bigcup_{k=1}^{\infty} (A \cap B_{k})
より
P(A)=P(k=1(ABk))=k=1P(ABk)P(Bk) P(A) = P( \bigcup_{k=1}^{\infty} (A \cap B_{k})) = \sum_{k=1}^{\infty} P(A | B_{k})P(B_{k})

命題2:Bayesの定理

B1,B2B_{1} , B_{2} \dotsを互いに排反な事象の列として、
P(Bk)>0P(B_{k}) \gt 0 , k=1Bk=Ω\bigcup_{k=1}^{\infty} B_{k} = \Omega
を満たすとき、任意の事象Aを与えたときのBjB_{j}の条件付き確率P(BjA)P(B_{j} \mid A)
次のように表される。

P(BjA)=P(ABj)P(Bj)k=1P(ABk)P(Bk)P(B_{j} \mid A) = \frac{P(A \mid B_{j})P(B_{j})}{\sum_{k=1}^{\infty}P(A \mid B_{k})P(B_{k})}

証明

P(BjA)=P(ABj)P(A)=P(ABj)P(Bj)P(A)P(B_{j} \mid A) = \frac{P(A \cap B_{j})}{P(A)} = \frac{P(A \mid B_{j})P(B_{j})}{P(A)}

ここで分母のP(A)P(A)に全確率の公式を適用すると、命題の式を得る。

事象の独立性

条件付き確率の定義より、事象AとBが同時に起こる確率は
P(AB)=P(AB)P(B)P(A \cap B) = P(A \mid B)P(B)
ここで、事象Aは事象Bとは全く独立に起こる場合を考えると、
P(AB)=P(A)P(A \mid B) = P(A)
よって、事象Aと事象Bが互いに独立であるとき
P(AB)=P(A)P(B)P(A \cap B) = P(A)P(B)が成り立つ。

定義

2つの事象AとBが、

P(AB)=P(A)P(B)P(A \cup B) = P(A)P(B)

を満たすとき、AとBは独立である。

(Advanced) 確率の連続性

事象の列 AkB,k=1,2,A_{k} \in \Beta, k=1,2,\dotsを考える。AkA_{k}

  • AkAk+1A_{k} \subset A_{k+1} のとき:単調増大列
  • AkAk+1A_{k} \supset A_{k+1} のとき:単調増大列


ここで確率について次のような性質が導かれる。

命題

(1) 事象の列 AkB,k=1,2,A_{k} \in \Beta, k=1,2,\dotsが単調増大列のとき
  P(k=1Ak)=limkP(Ak)P(\bigcup_{k=1}^{\infty}A_{k}) = \lim_{k \to \infty} P(A_{k}) (確率の連続性
(2) 事象の列 AkB,k=1,2,A_{k} \in \Beta, k=1,2,\dotsに対して、
 P(k=1Ak)k=1P(Ak)P(\bigcup_{k=1}^{\infty} A_{k}) \le \sum_{k=1}^{\infty}P(A_{k})

証明

(1) B1=A1,Bk=AkAk1C, k=2,3,B_{1} = A_{1}, B_{k} = A_{k} \cap A_{k-1}^{C}, k = 2, 3, \dots
とおくと、BkB_{k}, k=1,2,k=1,2,\dotsは互いに排反なので(バウムクーヘンの層をイメージ)
  P(k=1Bk)=k=1P(Bk)P(\bigcup_{k=1}^{\infty}B_{k})=\sum_{k=1}^{\infty}P(B_{k})
  また、明らかにk=1Bk=k=1Ak\bigcup_{k=1}^{\infty} B_{k}= \bigcup_{k=1}^{\infty}A_{k}である。
  一方、AkA_{k}は単調増加列であるから
k=1nP(Bk)=P(A1)+k=2n{P(Ak)P(Ak1)}=P(An)\sum_{k=1}^{n}P(B_{k}) = P( A_{1}) + \sum_{k=2}^{n}\{P(A_{k})-P(A_{k-1})\} = P(A_{n})
 とかけるので、nn \to \inftyの極限をとって
 k=1=limkP(Ak)\sum_{k=1}^{\infty} = \lim_{k \to \infty}P(A_{k})
以上から、(1)が成り立つことが示された。

(2)P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B) より、P(AB)P(A)+P(B)P(A \cup B) \le P(A) + P(B)
 これを一般化すると、P(k=1nAk)k=1nP(Ak)P(\bigcup_{k=1}^{n} A_{k}) \le \sum_{k=1}^{n} P(A_{k})
 ここで、Bn=k=1nAkB_{n}=\bigcup_{k=1}^{n} A_{k}とおくと、BnBn+1B_{n} \subset B_{n+1}となるので
 BnB_{n}は単調増加列。よって、
 P(n=1Bn)=limnP(Bn)P(\bigcup_{n=1}^{\infty}B_{n}) = \lim_{n \to \infty}P(B_{n})
 =limnP(k=1nAk)k=1P(Ak)= \lim_{n \to \infty}P(\bigcup_{k=1}^{n} A_{k})\le\sum_{k=1}^{\infty}P(A_{k})
 以上から、(2)が成り立つことが示された。