概要
本記事では、確率分布の特性を表す値について説明する。
代表的な値としては、平均、分散があげられるが、
これらは確率変数の関数の期待値として与えられる。
そこでまず離散型、連続型確率変数それぞれに対する期待値を定義し
これを用いて分布の特性値を導き出す。
期待値
期待値の定義
確率変数の関数の期待値は、
の期待値をとして以下のように定義される
ただし、であり、有限の値に収束しない場合は期待値は存在しない。
定義した期待値を用いて以下、分布の特性値を導き出す。
平均()
とすると、をの期待値もしくは平均といい
と表す。
これは、分布の中心を表す特性値である。
分散()
とおく。
のとき、期待値は存在し
これをの分散といい、もしくはで表される。
をの標準偏差という。
これは、分布の散らばりを表す特性値である。
これらを用い、分布の形状を表す特性値として歪度と尖度がある。
歪度 (skewness)
分布の中心からのズレ具合を表す特性値。
尖度 (kurtosis)
分布の尖り具合を表す特性値。
期待値の性質
を定数とし、関数の期待値が存在する仮定の下、以下が成り立つ
(1)
(2) (線形性)
(3) すべてのに対して
(4) すべてのに対して
(5)
(1),(2)の性質を使い、分散を期待値による表現に変形すると次のようになる。
同様の性質を用い、の平均と分散を求めると
平均:
分散:
最後に確率変数の標準化(規格化)について触れる。
である確率変数に対して
新たに確率変数として
とすると、の平均と分散はそれぞれ、前述までの性質を用いて
平均:
分散:
となる。