クロス集計表を理解して、あなたの研究・仮説検証を進展させよう!
この記事では、クロス集計表の超入門編として以下2つを紹介。
- 事例を使ってクロス集計表の基礎知識を紹介!
- どんなデータがクロス集計表に向いているのかを紹介!
現役大学教員の酒井宏平が丁寧に解説しますので、最後まで読んでいただけると、うれしいです。
クロス集計表って何?事例で理解しよう
クロス集計とは、2つ以上の質問項目の回答内容をかけ合わせ、回答者属性ごとの反応の違いを見るようなときに用いる集計方法です。
例えば、こんなデータがあったとします。
好物 | 出身地 | |
清水さん | そば | 関西 |
内村さん | そば | 関東 |
小寺さん | そば | 関東 |
松沢さん | そば | 関西 |
磯野さん | うどん | 関東 |
青木さん | うどん | 関西 |
小椋さん | うどん | 関西 |
中尾さん | そば | 関東 |
坂下さん | うどん | 関西 |
藤原さん | うどん | 関西 |
こういうデータは、クロス集計表で分析できます。
まず、好物と出身の2つの特徴からなる、4つタイプの人数を数えてください。
- うどん好きな関西人
- うどん好きな関東人
- そば好きな関西人
- そば好きな関東人
それぞれ、手で数えてみましょう。こんな感じになります。
- うどん好きな関西人:4名
- うどん好きな関東人:1名
- そば好きな関西人:2名
- そば好きな関東人:3名
そして、このデータをクロス集計表にします。
行は「好物」、列は「出身地」で構成される2×2の表を作ります。
関西 | 関東 | |
うどん | ||
そば |
この表の中に、先ほど数えた人数を入れていくだけです。
関西 | 関東 | |
うどん | 4 | 1 |
そば | 2 | 3 |
この表を見て、皆さんは好物と出身地に関して何かしらの傾向やパターンを発見できますか?
関西人を見てみると、うどん好き4名に対して、そば好き2名なので、うどん好きが多いことがわかります。一方、関東の人はうどん好き1名に対して、そば好き3名なので、そば好きが多いことがわかります。
つまり、(このデータは僕がテキトーに作ったデータですが、)このデータからは、「関西の人はうどん好き」、「関東の人はそば好き」な傾向がわかったことになります。
これがクロス集計表です。
クロス集計表で扱えるデータとは?
クロス集計表がどんなものなのかはわかったと思いますが・・・
- 一体どんなデータならクロス集計表が使えるのか?
- 一体どんなアンケートの質問文なら良いのでしょうか?
アンケートの回答データを直接クロス集計表を使って分析したい場合、質問文は以下のような形になります。
- 質問例1:朝ごはんは食べますか?
- 選択肢1:はい
- 選択肢2:いいえ
- 質問例2:夜ごはんはどれくらい食べますか?
- 選択肢1:たくさん
- 選択肢2:ふつう
- 選択肢3:少なめ
こういう選択肢を選ぶ形の質問文であれば、表の行列に選択肢を格納するだけで2×3のクロス集計表を作ることができます。
夜多め | 夜ふつう | 夜少なめ | |
朝、食べる(はい) | |||
朝、食べない(いいえ) |
しかし、別に選択肢形式の質問文にしなくても、クロス集計表は作れます。
例えば、「身長は何センチですか?」という質問の回答パターンは無限にあります。
165.5cmの人もいれば、190cmの人もいますし、140cmの人もいます。140.5cmの人もいれば、140.6cmの人もいます。このようなデータでクロス集計表を作ると、行列が無限に増えて、理解不能なことになります。
そこで、無限にあるデータをこちらで区切ってしまうことで、クロス集計表を作ると言う方法があります。
例えば・・・
- 150cm未満の人
- 150cm以上、170cm未満の人
- 170cm以上の人
このように3分類だけにすると、クロス集計表を作ることができます。例えば以下のような2×3のクロス集計表になります。
150cm未満 | 150〜170cm | 170cm以上 | |
中学生 | |||
高校生 |
つまり、正直なことを言うと、どんなデータでもクロス集計表を使って分析できます。
まとめ
クロス集計表について紹介しました。小さなデータであれば、紙とペンだけでもクロス集計表を作ることが可能です。
クロス集計表を使えば、見えにくかった傾向やパターンを、たやすく読み解くことができます。
ただ、10×10のような大きすぎる表は、理解しづらくなりますので、あなたが理解できる適度なサイズのクロス集計表を作りましょう。