概要
観測されたデータと確率との間を橋渡しする概念として確率変数があり
確率変数の従う分布が確率分布である。
本記事では、以下の内容について触れる
- 確率変数と累積分布関数
- 確率関数・確率密度関数
確率変数と累積分布関数
確率変数
確率とは事象に対して定義されるが、事象を直接扱うと実際には不便な事が多く
要約したものを扱う方が実用的である。
例えば、サイコロを100回振って1が出る回数を考える場合
全事象は個の元からなるが、この問題で重要なのは出方ではなく
出た回数である。この数をとするとの取りうる値の集合は
となる。
すなわち、は全事象から実数への関数で、これが確率変数である。
ここで確率変数の定義を述べる。
一般的に、 を全事象、をの可測集合族、を上の確率とするとき、
確率変数とは、に対してを対応させる関数である。
また、任意の実数に対してである確率は
次式のように上で定義された確率を用いて与えられる。
一般に、集合に対してとなる確率は
で定義され、特にが区間に入る確率は
で与えられる。
実現値と標本空間
1つのに対して、が定まり、このを実現値といい
実現値の全体はで表され、これをの標本空間という。
累積分布関数(分布関数)
確率変数が以下である確率は累積分布関数(以下、分布関数)で与えられ
以下のような式で定義する。
分布関数を用いると、例えばとなる確率は
となり、となる確率は
累積分布関数の必要十分条件
(1)
(2) はの非減少関数
(3) は右連続関数
離散型確率変数と連続型確率変数
が階段関数であるとき、Xは離散型確率変数であり(例:サイコロの目など)
が連続関数であるとき、Xは連続型確率変数である(例:身長、体重など)。
確率関数
累積分布関数とはすなわちとなる確率を表していたが
ここではとなる確率を求める。
まず、離散型確率変数に対して、次のような確率関数を与える。
に対する標本空間
とすると確率関数は以下のようになる。
ただし、
累積分布関数は
となり、これより確率関数は以下のように導かれる。
(はに負側から近づけたときのの極限値)
この式より、
のとき、
のとき、
が確かめられる。
確率密度関数
次に、連続型確率変数に対して、
となる関数が存在するとき、を確率密度関数という。
ただし、