Blog Article

確率変数と確率(密度)関数

概要

観測されたデータと確率との間を橋渡しする概念として確率変数があり
確率変数の従う分布が確率分布である。
本記事では、以下の内容について触れる

  • 確率変数と累積分布関数
  • 確率関数・確率密度関数

確率変数と累積分布関数

確率変数

確率とは事象に対して定義されるが、事象を直接扱うと実際には不便な事が多く
要約したものを扱う方が実用的である。

例えば、サイコロを100回振って1が出る回数を考える場合
全事象は61006^{100}個の元からなるが、この問題で重要なのは出方ではなく
出た回数である。この数をXXとするとXXの取りうる値の集合は
{0,1,2,,100}\{0,1,2, \dots ,100 \}となる。

すなわち、XXは全事象から実数への関数で、これが確率変数である。

ここで確率変数の定義を述べる。
一般的に、Ω\Omega を全事象、B\BetaΩ\Omegaの可測集合族、PP(Ω,B)(\Omega , \Beta)上の確率とするとき、
確率変数とは、ωΩ\omega \in \Omegaに対してX(ω)RX(\omega) \in \realsを対応させる関数XXである。

また、任意の実数xxに対してXxX \le xである確率は
次式のように(Ω,B)(\Omega, \Beta)上で定義された確率PPを用いて与えられる。
P(Xx)=P({ωΩX(ω)x})P(X \le x) = P(\{ \omega \in \Omega \mid X( \omega ) \le x \})

一般に、集合AXA \subset Xに対してP(XA)P(X \in A)となる確率は
P(XA)=P({ωΩX(ω)A})P(X \in A) = P(\{ \omega \in \Omega \mid X(\omega) \in A\})
で定義され、特にXXが区間(a,b](a, b]に入る確率は
P(a<Xb)=P({ωΩa<X(ω)b)})P(a \lt X \le b) = P(\{\omega \in \Omega \mid a \lt X(\omega) \le b)\})
で与えられる。


実現値と標本空間

1つのωΩ\omega \in \Omegaに対して、X(ω)=xX(\omega) = xが定まり、このxx実現値といい
実現値の全体はX={X(ω)ωΩ}X = \{X(\omega) \mid \omega \in \Omega \}で表され、これをXX標本空間という。

累積分布関数(分布関数)

確率変数XXxx以下である確率は累積分布関数(以下、分布関数)で与えられ
以下のような式で定義する。
FX(x)=P(Xx)F_{X}(x) = P(X \le x)
分布関数を用いると、例えばa<Xba \lt X \le bとなる確率は
FX(a<Xb)=F({Xb}{Xa})=P(Xb)P(Xa)=F<em>X(a)F</em>X(b)F_{X}(a \lt X \le b) = F(\{X \le b\} \setminus \{X \le a\}) = P(X \le b) - P(X \le a) = F<em>{X}(a) - F</em>{X}(b)
となり、X>aX \gt aとなる確率は
FX(X>a)=F({Ω}{Xa})=1FX(a)F_{X}(X \gt a) = F(\{ \Omega \} \setminus \{X \le a \}) = 1 - F_{X}(a)

累積分布関数の必要十分条件

(1) limxFX(x)=0,limxFX(x)=1\lim_{x \rarr -\infty} F_{X}(x) = 0, \lim_{x \rarr \infty} F_{X}(x) = 1
(2) FX(x)F_{X}(x)xxの非減少関数
(3) FX(x)F_{X}(x)は右連続関数

離散型確率変数と連続型確率変数

FX(x)F_{X}(x)が階段関数であるとき、Xは離散型確率変数であり(例:サイコロの目など)
FX(x)F_{X}(x)が連続関数であるとき、Xは連続型確率変数である(例:身長、体重など)。

確率関数

累積分布関数とはすなわちXxX \le xとなる確率を表していたが
ここではX=xX = xとなる確率を求める。


まず、離散型確率変数XXに対して、次のような確率関数を与える。
fX(x)=P(X=x)f_{X}(x) = P(X= x)
XXに対する標本空間X={x1,x2,},x1<x2<X = \{x_{1}, x_{2}, \dots \}, x_{1} \lt x_{2} \lt \cdots
p(xi)=P(Xi=xi),i=1,2,p(x_{i}) = P(X_{i} = x_{i}), i = 1,2, \cdots とすると確率関数は以下のようになる。

fX(x)={p(xi) (x=xiのとき)0 (xXのとき)f_{X}(x) = \begin{cases} p(x_{i}) &\text{ } (x = x_{i} のとき) \\ 0 &\text{ } (x \notin X のとき) \end{cases}

ただし、fX(xi)0i=1fX(xi)=1f_{X}(x_{i}) \ge 0 \sum_{i = 1}^{\infty}f_{X}(x_{i}) =1
累積分布関数はFX(x)=i:xixfX(xi)F_{X}(x) = \sum_{i:x_{i} \le x} f_{X}(x_{i})
となり、これより確率関数fX(x)f_{X}(x)は以下のように導かれる。
fX(x)=FX(x)FX(x)f_{X}(x) = F_{X}(x) - F_{X}(x-)
(FX(x)F_{X}(x-)xxに負側から近づけたときのFX()˙F_{X}(\dot)の極限値)
この式より、
x=xix=x_{i}のとき、fX(xi)=FX(xi)FX(xi)=p(xi)f_{X}(x_{i}) = F_{X}(x_{i}) - F_{X}(x_{i}-)=p(x_{i})
xi<x<xi+1x_{i} \lt x \lt x_{i+1}のとき、fX(x)=FX(x)FX(x)=0f_{X}(x) = F{X}(x) - F{X}(x-)=0
が確かめられる。

確率密度関数

次に、連続型確率変数XXに対して、

FX(x)=xfX(t)dt (<x<)F_{X}(x) = \int_{-\infty}^{x}f_{X}(t)dt (-\infty \lt x \lt -\infty) fX(x)=ddxFX(x)f_{X}(x) = \frac{d}{dx} F_{X}(x)

となる関数fX(x)f_{X}(x)が存在するとき、fX(x)f_{X}(x)確率密度関数という。
ただし、fX(x)0fX(x)dx=1f_{X}(x) \ge 0 \int_{-\infty}^{\infty}f_{X}(x)dx =1