【クロス集計とは?】何が出来る?を具体例で分かりやすく解説
クロス集計とは
クロス集計とは、2つ以上の設問を組み合わせて(”クロス”させて)集計する手法の事です。
クロスさせて集計する事で、性別や年代別などの傾向を見ることができます。
設問ごとに細かい傾向をつかむ事ができるため、単純集計を見ただけでは分からない、より深い分析を行なうことができます。
質問項目を1つの表の「表頭(ひょうとう)」と「表側(ひょうそく)」に分け、それぞれのカテゴリー(選択肢)が交わるセルに、表頭と表側の両方に該当する回答数やその回答比率を記載した表をクロス集計表といいます。
表側と表頭とは?
2つ以上の質問項目を、1つの表の「表頭」と「表側」に振り分け、それぞれの質問の選択肢が交わるセルの回答数や比率を算出します。表の左側を「表側」、上側を「表頭」と呼びます。
クロス集計の実例を簡単に具体例で解説
上の2つの表は『年代別』と『海外旅行への興味』を掛け合わせたクロス表です。
クロスした箇所を回答者数で作成したクロス表を「N表(実数表)」(上表)と呼び、N表から割合を算出して%で作成した表を「%表」(下表)と言います。
他にもN表と%表を一緒にした「N%表」もあります。
例えば、『10代と20代』で『旅行の関心度』はどのくらい違うのかを知りたいとき、『年代別』と『旅行の関心度』を使ったクロス集計表を作ると、その違いを明らかにすることが出来ます。
このとき、『旅行の関心度』の違いを見るのを「目的」として『年代別』に「説明」するため、『年代別』は「説明変数」、『旅行の関心度』は「目的変数」と呼ばれ、表側に説明変数・表頭に目的変数を配置するのが日本では一般的です。
(※表側に目的変数・表頭に説明変数を配置するのは縦%表と呼ばれ、欧米だと縦%表の方がよく用いられる)
この目的と説明をひっくり返して、『旅行の関心度』はどの『年代』が多いのかを知りたいときは、表側に『旅行の関心度』、表頭に『年代別』となるように配置します。
説明変数は基本的に「分析軸(軸)」と呼ばれ、どこをクロス集計を作成するか迷ったときは、この分析軸を性別や年代などの属性にして、全質問とクロスすれば、どんな属性によってアンケートの結果に違いがあるのかがつかみやすくなります。
かけ合わせ方によって、質問間クロス、多重クロスなどと呼ぶこともあります。
クロス集計はExcelのピボットテーブルなどを使えば誰でも作成できますが、多量のクロス集計表を作成しなければならない時や、複雑な掛け合わせのクロス集計表を作成するのは大変な作業になります。
「%表」を計算するとき、日本では一般的に表側の回答数を100%として計算します。
この表側のことを「分析軸(軸)」と呼び、上記「%表」では軸を年齢の項目毎(10代、20代…毎)に%を算出しています。
このクロス集計表から分かることは、
全体での集計では、『海外旅行への興味』は「どちらともいえない」が158人(41.5%)で最も多く見える
一方『年代別』とクロス集計することにより、10代では100人の内半数以上の57人(57.0%)が「興味がある」と回答しており、10代では全体に比べると海外旅行に「興味がある」人の割合が高い
ということです。
同じデータでもクロス集計する事でより具体的で正確な意見を抽出する事が可能となります。
分析軸とは?
分析軸とは、クロス集計における「比率を出す時のベース」になるものです。
『年代別』に「興味度」の比率を比較したい場合は『年代別』を軸にします。
逆に、『興味度』別に『年代別』の比率を比較したい場合は『興味度』を軸にします。
「表側」を「分析軸」と呼ぶこともありますが、日本では表側の位置に分析軸があるのが一般的なためそう呼ぶだけであって、これは正解ではありません。
分析軸の決め方
まず調査票を作成する際に、「何のために調査をするのか」がなくただ作るだけでは、調査の目的がないのでクロス集計をしても大きな意味を得られません。
例えば、女性ばかりのアンケートで性別を分析軸にしてクロス集計をしても、性別の差が見られないので意味がありません。
調査票を作る際に何が知りたいのかを明確にしておくのが大切です。
上記の例では、分析軸は【『年代別』に「興味度」の比率が見たい】という「興味度」を説明するためのものになります。
分析軸を決める際は、『どういった分け方で比較したいか』をあらかじめ決めておき、分析軸として使う設問を調査に入れておくことが必要です。
性別・年代などは分析する際、基本的な分析軸になります。
また性別と年代をかけて性年代別にクロス(男性20代×Q1など)するのも一般的です。
単純集計の結果を見て「こことここをクロスしたら面白い結果が得られそうだ」と決めるのも一つの方法です。ただ、それには調査内容にきちんと目的があり、内容を理解していることが重要です。