施策の効果をどうやって測るか(1) - 仮説検定とは

なんかの施策を打ったときに，それが実際に効果を持っていたか，というのを正しく測定するにはどうしたらいいのでしょうか．ということで今回はべたべたですが統計的仮説検定のお話です．定義的な部分が先にくるのはご容赦を...

そもそものきっかけは，お仕事でχ2検定周りを復習したり，サンプルサイズの決め方を読んだりしていて，そういやそもそも検定って何だっけとかいう根本的なことについて，理解のし直しをしたりしていました．大学の学部で習ったはずなんだけど，まるですっかり理屈の部分が抜けたりしているのですね...　といったところが発端です．

サンプルサイズの決め方 (統計ライブラリー)

作者: 永田靖
出版社/メーカー: 朝倉書店
発売日: 2003/09/01
メディア: 単行本
購入: 20人クリック: 277回
この商品を含むブログ (15件) を見る

定義的なもの

統計学入門 (基礎統計学)

作者: 東京大学教養学部統計学教室
出版社/メーカー: 東京大学出版会
発売日: 1991/07/09
メディア: 単行本
購入: 158人クリック: 3,604回
この商品を含むブログ (77件) を見る

手元にあった東大出会の統計学入門を引っ張りだして，第12章の序文のところを引いてみると，

「仮説検定」は，統計的仮説の「有意性」の検定である．仮説の下でわれわれが期待するものと，観測した結果との違いを，これらの差が単に「偶然」によって起こったものか否かという見地から，確率の基準で評価する．

とのことです．ターゲットとなる出来事が，偶然に起こったのかどうかを確率的な基準で判断して，それが確率的にまれにしか起こらないはずであれば，それは偶然じゃなく意味がある差なんだよ，と考えるわけですね．で，ここでいう確率的な基準を当てはめるために使われるのが，一般に「統計量」と呼ばれる指標です．

この統計量は，すでに分布の形がわかっており，実際の数値を当てはめて計算することで，分布内のどの辺りに位置しているものかがわかるようなものが用いられます．と言葉で書いてもわかりにくいので，例を挙げましょう．

t統計量

t統計量とは，t分布という分布に従うような値のことをさします．最も良く知られている，スチューデントのt統計量は，以下の数式で表されます．

$T=\frac{(\bar{x}-\mu)}{\frac{s}{\sqrt{n}}}$

ここで $\bar{x}$ は変数xの得られたデータの平均値， $\mu$ は母集団の真の平均， $s$ は変数xの得られたデータの標準偏差， $n$ は得られたデータ数です．で，データを当てはめて得られるt統計量Tが，事前に定めた有意水準を超えた場合に，これは偶然じゃない，というふうに結論づけるわけです．