統計 正規分布についてメモ

ほかの技術知識

前回(離散型の確率分布についてメモ)の続き。

正規分布とその派生形(対数正規分布,カイ2乗分布,t分布,F分布)のほか、一様分布や指数分布、ガンマ分布などいろいろあるが、とりあえず正規分布に注目する。

正規分布

確率密度関数

式はμを中心に左右対称のグラフである。特に、μ = 0、σ = 1の正規分布N(0, 1)を標準正規分布という。

正規分布の確率密度関数

 

分布のかたち

正規分布と言えば「釣鐘型」のイメージが正規分布と言えば「釣鐘型」のイメージ強いが、実際にN(0,1)のグラフを区間(-10,10)で描いてみると思っていたよりも細い(左図)。ためしに、区間を半分の(-5,5)に変えてみた(右図)。これでもまだ、頭部(?)に丸みが足りない気がするが、まぁいい。

ちなみに、Wikipediaで調べた釣鐘の画像はこんな感じ。

Wikipediaより
(Cory, CC BY 2.1 jp, https://commons.wikimedia.org/w/index.php?curid=1465733による)

標準化

標準化

標準正規分布N(0,1)になっていない分布(=平均:0、分散:1ではない分布)を標準正規分布にするための操作。区間(a, b)で、正規化した結果 ZaZb)が取りうる値は、

P(aZb) = P(μ ≦Xμ+bσ)

に従う。

練習

【問】N(10,22) に従う確率変数Xに対してP(X≧9.5)を求めよ。

①標準化する

②確率分布を求める

Z ≧−0.25 だから、「0 ≦ Z ≦ 1 の部分の確率=0.5」と、「−0.25 ≦ Z ≦ 0の部分の確率」=「0 ≦ Z ≦ 0.25の部分の確率」に分けて考える。

正規分布の確率分布表には(0を基準に左右対称なので)上側確率分布しか掲載されていないことを考慮すると

Q) 正規分布が大事な理由は?

A) X1,X2…,Xnが独立に同一分布に従う確率変数であるとき、中心極限定理により、もとの分布がどれくらい正規分布からかけ離れた形をしているかにもよるが、大体n=30もあればその分布は正規分布とみなしてよいから。