Cross Table

クロス集計

例題: 2つのクラスで，ある意見に対する賛成･反対を集計しました。クラスごとに，男女別の賛成と反対の人数を 2 X 2 のクロス集計表にまとめました。

集計結果を SPSS のデータシートに入力します。
頻度をケースの重み付け変数として指定します。
左の枠内にあった頻度を選択し，度数変数の欄に挿入しました。
分析メニューからクロス集計表を選択します。
左の枠内にあった男女を行の欄に，また，賛成反対を列の欄に挿入します。さらに，クラスを層の欄に挿入します。
統計のボタンをクリックし，必要な統計量をチェックします。ここでは，カイ２乗分析を選択します。
セルのボタンをクリックし，必要な項目をチェックします。

OK ボタンをクリックすると，クラス1 とクラス2 についてのクロス集計表が出力されます。

カイ二乗検定ではサンプルサイズが小さいと χ2分布への当てはまりが悪くなります。そのため，すべてのセルの期待値が 5以上であることが一つの経験的基準として知られています。Howell (2002, p. 159) は，この基準は厳しいものなので，当てはまらないからといって過度に罪悪感を持つことはないと述べています。しかし，サンプルサイズが小さいと検定力は低下することが知られています。

カイ２乗検定の表には，各種の統計量が表示されています。

Fisher の直説法を用いた両側検定で，SPSSがどのような場合を考慮して計算しているかは示されません。通常は，データが示すパターンの確率（クラス1 の例では (30C21 X 33C11)/63C32 = .0030）と等しいか，より小さい確率を示すパターンの確率を合計して両側検定の確率が計算されます（Agresti, 2003, p. 57）。上記クラス1 の例ならば，男性の賛成が 21名以上の場合と 9名以下の場合の確率を合計します。各行の周辺度数が等しい場合には，両側検定の確率は片側検定の確率の 2倍になります。

サンプルが小さいときに Fisher の直説法が推奨されます。しかし，Fisher の直説法では確率を計算する際に周辺度数が固定される点が問題です。今回の例では賛成と反対の人数は統制できないので，Fishser の直説法が必ずしも適切であるとはいえないでしょう (Howell, 2002, p. 155)。

たとえば，20個のコップに缶コーヒーを注いだとします。そのうちの 10個のコップには新しい銘柄が，残りの 10個のコップには従来の銘柄が注がれています。判定者には，新しい銘柄が入っている 10個のコップと，古い銘柄が入っている 10個のコップに分けるように求めたとします。そのような場合，Fisherの直説法を用いることが適切であるといえます。

カイ二乗検定が有意な結果である場合，期待度数と観察度数の差を，調整済みの標準化残差と標準正規分布を用いて検定することができます。

確率は以下のように計算します。
SPSS に組み込まれている標準正規分布の累積分布関数を用いて，調整済み標準化残差の確率を計算します。
新しい変数 P が作成され，調整済み残差が 2.9 であるときの確率が .0037 であることがわかります。

確率は，エクセルなど表計算ソフトを用いても容易に計算できます。エクセルの場合，スプレッドシートのセルに =(1-NORMSDIST(2.9))*2 を入力すれば確率 ( .0037) が表示されます。