統計 推定・検定についてメモ

ほかの技術知識

「統計」について手持ちの教科書と過去のノートで復習したときのメモの一部。

推定と検定

比較や相関関係などの統計的解析手法を用いて、計数データから何らかの一般化できる結論を導出する(推論する)ことが、統計解析の重要な目的になっていることが多い。大雑把にまとめれば「部分を調べて(全体を調べることなく)全体を語る」ための手法が推論であり、推定と検定は、その推論の中で多く使われる手法、ということのようだ。なお、推定と検定を合わせて統計的推論という。

分布を表現する用語の確認

推定や検定の前段階の作業として、基本統計量やヒストグラム・散布図などを使って、計数データの分布を観察するという工程がある。まず、用語の意味を確認する。

  • 代表値(average):分布を代表する値のこと。代表値には、平均値・中央値・最頻値の3種類がある。
  • 平均値(mean):平均値には、算術平均(arithmetic mean)・幾何平均(geometric mean)・調和平均(harmonic mean)の3種類があり、分布の様子によって使い分ける。
  • 中央値(median):データを大きさの順に並べたときに中央にくる値
  • 最頻値(mode):もっとも多く観察された値で、ヒストグラムを書いた場合の一番高い山の場所をあらわす。連続変数の分布を表現する際にはほとんど使われない。
  • 母集団( population):無限個のデータの集まりを考え、その中には大小さまざまなデータ値が含まれるとするとき、このデータの集まりを母集団という。
  • 標本(sample):母集団から取り出したデータのこと。標本がいくつのデータで成立っているかを「標本数」や「サンプルサイズ」という。
  • 抽出(sampling):母集団から標本を取りだすこと。母集団のどのデータも等しい確率で取りだす無作為抽出(ランダムサンプリング)が基本。
  • パラメトリック(parametric):日本語では「母集団特性値の」「母数の」という意味である。計測して得られた(計数)データを扱う手法であり、母集団について正規性や等分散性などの仮説が設けられる。
  • ノンパラメトリック(non-parametric):母集団について仮定を設けない方法であり、母集団の分布がどうであっても適応可能である。
パラメトリックとノンパラメトリックの使い分け
パラメトリックな手法は母集団についてさまざまな前提条件があるが、標本の値の大小の程度を考慮して解析できるので有意差が出やすい。いっぽう、ノンパラメトリックな手法は前提条件を必要としないが、比較的有意な結果が出にくい。
―> 手持ちのデータが計数データの場合は、まずパラメトリックな手法が適用できるかどうかを考え、適用できない場合にノンパラメトリックな手法を用いる。

データ変換

計数データの解析方法は、ほとんどの場合「標本は正規分布する母集団から抽出されたものである」という仮定に基づく。対象のデータがその仮定に当てはまらない場合、対数変換や平方根変換を使ってデータを変換することにより、正規分布として扱えることがある。

対数変換

pHが、水素イオン濃度を対数変換した上に符号をひっくり返した値(-log10[H+])であるように、便宜的にデータを対数変換する。

対数変換された各値と平均値(算術平均)は、逆対数変換をすれば元の値に戻すことができるが、標準偏差と標準誤差は逆対数変換しても元の形に戻らない。

対数変換した値から得られる標準偏差(SD)と標準誤差(SE)

 対数変換したデータで標準偏差を計算する場合、「対数変換した値」と「対数変換した値の算術平均」との差を計算する必要がある。しかし、対数の「差」の計算は除算、つまり比率になってしまう。そのため、対数変換したデータから得られる標準偏差には元の値の単位は反映されず、対数変換したデータから得られた標準偏差・標準誤差を逆変換して元の値に戻すことはできない。
 ただし、標準誤差は平均値からのばらつきを表しているので、対数変換後のデータの分布については意味があり、信頼区間の計算に使うことはできる。

推定

母集団についての何らかの量を標本から求めることを推定と呼び、点推定と区間推定がある。

点推定

標本から求められるただ一つの値によって母数を推定する。たとえば、標本平均の値で母集団の平均を推定することなどが挙げられる。しかし、母集団の一部の標本に基づいて母集団全体に係る値を推定するため、誤差の評価をどうするのか、という問題が発生する。この誤差の評価手法として、不偏推定量や最尤推定量などがある。

区間推定

標本から母数が含まれるであろう区間を推測する。つまり、標本から、2つの値(統計量)を計算し、その2つの値の間に母数が含まれていることを推定する。たとえば、平均:μ、分散:σ^2 の正規分布について、σ^2を既知として、μを推定する場合を考える。信頼計数95%信頼区間について推定する場合、その上限値と下限値が信頼限界となる。

なお、何回も標本を取り直してμの区間推定を繰り返すとき「95%信頼区間」が意味するのは、繰返しの中でおよそ95%は正しくμを推定している(=5%くらいは外れている)ということになる。この5%が、この区間推定における誤差である。

正規分布に独立に従う場合の区間推定

また、上式から、誤差を小さくするために信頼計数99%信頼区間について推定しようとすると、つまり、「1.96」の部分が「2.56」に変更すると、信頼区間の幅が広くなることがわかる。ということはつまり、区間推定の誤差は信頼計数と区間の幅の両方から成り立つと考えられる。

一般に、幅を広げることで信頼計数を高くすることができるが、幅を短くし同時に信頼計数を大きくすることは、標本数を決めている以上はできない。よって、仕方がないので信頼計数を固定してなるべく幅の短い信頼区間を求めようとすることになる。

検定

仮説を建てて、実験結果がその仮説を支持するかどうかを統計学的に検討する手順を検定とよび、その目的は

①沢山のデータを集めてどうなっているかを整理して提示すること
②集めたデータから何らかの推論をすること

といえる。工場の不良品率などを調べる際は①の目的だが、実験結果から一般化できる結論を引き出す際の目的は②になる。

用語の確認

  • 対立仮説(alternative hypothesis):たいていは検定を実施する人間が本当であって欲しいと思う内容の仮説。記号はH1
  • 帰無仮説(null hypo hypothesis):対立仮説とは反対の内容の仮説。検定の結果、棄却されるもの。記号はH0
  • 第1種の過誤(type 1 error):本当は有意でないのに間違って帰無仮説を棄却してしまう過ち。擬陽性
  • 第2種の過誤(type 2 error):本当は有意なのに間違って帰無仮説を採用してしまう過ち。擬陰性
検定統計量(test statistic)と検定

検定では、帰無仮説が正しいと仮定したときの検定統計量を計算し、その検討量が得られる確率がどのくらいかに応じて判断を行う。

検定統計量=(実験値-帰無仮説の値)/ 実験値の標準誤差

検定の手順

  1. そうであって欲しいと思う仮説を対立仮説とする
  2. 対立仮説と反対の仮説を帰無仮説 とする
  3. 帰無仮説が正しいと仮定した場合の検定統計量の分布を描く(検定統計量=(実験値-帰無仮説の値)/ 実験値の標準誤差)
  4. 基準になる確率(有意水準)を求める。通常、0.05(5%)、0.01(1%)、0.001(0.1%)に設定する
  5. 検定統計量を棄却域(帰無仮説が正しい場合には起りにくい領域)とそれ以外に分ける
  6. 実際のデータから計算した検定統計量が棄却域に入るかどうかを確認する。棄却域に入れば、帰無仮説を棄却する
例外の扱い
統計では95%くらいはそのとおりだろうが5%程度は例外はあり得る、ということを検定の基本としている。その点で、例外(反例)が1つでもあれば仮説を棄却してしまう数学の証明などとは根本的に異なる。