Blog Article

確率分布の特性値

概要

本記事では、確率分布の特性を表す値について説明する。
代表的な値としては、平均、分散があげられるが、
これらは確率変数の関数の期待値として与えられる。
そこでまず離散型、連続型確率変数それぞれに対する期待値を定義し
これを用いて分布の特性値を導き出す。

期待値

期待値の定義


確率変数XXの関数g(X)g(X)の期待値は、
g(X)g(X)の期待値をE[g(X)]E [ g(X) ]として以下のように定義される

E[g(X)]={g(x)fX(x)dx (Xが連続型確率変数のとき)xiXg(xi)fX(xi) (Xが離散型確率変数のとき)E[g(X)] = \begin{cases} \int_{-\infty}^{\infty} g(x)f_{X}(x)dx &\text{ }(Xが連続型確率変数のとき)\\ \sum_{x_{i} \in X}g(x_{i})f_{X}(x_{i}) &\text{ }(Xが離散型確率変数のとき)\end{cases}

ただし、E[g(X)]<E[g(X)] \lt \inftyであり、有限の値に収束しない場合は期待値は存在しない。
定義した期待値を用いて以下、分布の特性値を導き出す。

平均(μ\mu

g(X)=Xg(X)=Xとすると、E[X]E[X]XXの期待値もしくは平均といい
μ=E[X]\mu = E[X]と表す。
これは、分布の中心を表す特性値である。

分散(σ2\sigma^{2})

g(X)=(XE[X])2g(X) = (X - E[X])^{2}とおく。
E[(Xμ)2]<E[(X - \mu)^{2}] \lt \inftyのとき、期待値E[(Xμ)2]E[(X - \mu)^{2}]は存在し
これをXX分散といい、Var(X)Var(X)もしくはσ2\sigma^{2}で表される。
σ=Var(X)\sigma = \sqrt{Var(X)}XX標準偏差という。
これは、分布の散らばりを表す特性値である。

これらを用い、分布の形状を表す特性値として歪度と尖度がある。

歪度 (skewness)
分布の中心からのズレ具合を表す特性値。
β1=E[(Xμ)3]Var(X)3\beta_1 = \frac{E[(X - \mu)^3]}{\sqrt{Var(X)^3}}

尖度 (kurtosis)
分布の尖り具合を表す特性値。
β1=E[(Xμ)4]Var(X)2\beta_1 = \frac{E[(X - \mu)^4]}{Var(X)^2}

期待値の性質

a,b,ca,b,cを定数とし、関数g(X),g1(X),g2(X)g(X), g_1(X), g_2(X)の期待値が存在する仮定の下、以下が成り立つ
(1) E[c]=c,特にE[1]=1E[c] = c, 特にE[1] = 1
(2) E[ag(X)+bg1(X)+cg2(X)]=aE[g(X)]+bE[g1(X)]+cE[g2(X)]E[ag(X) + bg_1(X) + cg_2(X)] = aE[g(X)] + bE[g_1(X)] + cE[g_2(X)] (線形性)
(3) すべてのxxに対して g(x)0E[g(x)]0g(x) \ge 0 \rArr E[g(x)] \ge 0
(4) すべてのxxに対して g1(x)g2(x)E[g1(x)]E[g2(x)]g_1(x) \ge g_2(x) \rArr E[g_1(x)] \ge E[g_2(x)]
(5) E[g(X)]E[g(X)]|E[g(X)]| \le E[|g(X)|]

(1),(2)の性質を使い、分散Var(X)Var(X)を期待値による表現に変形すると次のようになる。
Var(X)=E[(Xμ)2]=E[X22Xμ+μ2]=E[X2]{E[X]}2Var(X) = E[(X - \mu)^2]= E[X^2 - 2X\mu + \mu^2] = E[X^2] - \{E[X]\}^2
=E[X(X1)]+E[X]{E[X]}2 = E[X(X - 1)] + E[X] - \{E[X]\}^2

同様の性質を用い、aX+baX+bの平均と分散を求めると
平均:E[aX+b]=aE[X]+bE[aX+b] = aE[X] + b
分散:Var(aX+b)=E[{aX+bE[aX+b]}2]=a2E[(XE[X])2]=a2Var(X)Var(aX+b) = E[\{aX + b - E[aX+b]\}^2] = a^2E[(X - E[X])^2] =a^2Var(X)

最後に確率変数の標準化(規格化)について触れる。
μ=E[X],σ2=Var(X)\mu = E[X], \sigma^2 = Var(X)である確率変数XXに対して
新たに確率変数ZZとして
Z=XμσZ = \frac{X - \mu}{\sigma}
とすると、ZZの平均と分散はそれぞれ、前述までの性質を用いて
平均:E[Z]=0E[Z] = 0
分散:Var(Z)=σ2Var(X)=1Var(Z) = \sigma^{-2}Var(X) = 1
となる。