執筆者: リサーチャー T.A
※NIリサーチャーコラムでは、当社の各リサーチャーが日々の業務等で感じた事を自由に紹介しています。
◆ また春が来て、新年度が始まります。
来たる2025年度に予定されている大きな行事やイベントを考えた時、真っ先に思いつくのは、まもなく開催される「大阪万博」という方が多いでしょうか?
市場調査業界に長くいることもあり、私の中での2025年の大きな予定といえば、春の実施ではないのですが、10月に行われる5年に1度の「国勢調査」も頭に思い浮かぶ1つの大きなイベントです。
『国勢調査』とは
日本に住んでいるすべての人と世帯を対象とした、日本で最も重要な統計調査です。
生活環境の改善や防災計画の立案等、生活に欠かせない様々な行政施策に役立てられる大切な調査です。
(※総務省統計局「国勢調査とは」より抜粋)
と、あるように、国内全体を対象とした大規模な調査を行うことで、正確性や公正性のある、信頼性の高い統計データが得られ、それらを活用していくことで社会に役立てられていくことに繋がる、ある種のビッグな恒例行事となります。
また、国勢調査で得られたデータは、マーケティングリサーチの調査の設計や分析にも活用されている極めて重要な2次データとなっています。
前回2020年の国勢調査は、後世に語り継がれる未曾有のコロナ禍のど真ん中で実施され、弊社も“国勢調査サポーター企業”として名乗りを上げ、国勢調査の啓もう・広報活動に微力ながら協力をさせていただきました。
今回2025年の国勢調査においても、協力をさせていただく準備を現在進めているところです。
◆ 国勢調査のデータ

国勢調査で聴取されるのは、性別や年齢、居住地、配偶関係や就業状態などの基本的な属性情報がほとんどで、2025年の調査事項は以下17項目とされています。
【世帯員に関する事項】
氏名、男女の別、出生の年月、世帯主との続き柄、配偶の関係、国籍、現在の住居における居住期間、5年前の住居の所在地、就業状態、所属の事業所の名称及び事業の種類、仕事の種類、従業上の地位、従業地又は通学地
【世帯に関する事項】
世帯の種類、世帯員の数、住居の種類、住宅の建て方
実際に聴取されたこれらのデータは集計され、2020年の調査結果を一例に使うと、左側が年齢1歳刻み、右側が47都道府県別の人口のグラフのようなデータとなります。

データは上記のように各属性単体で使うこともあれば、さらにデータを掛け合わせて、エリア×性年代などのような、より詳細なデータとして活用もできるようになっています。
◆ データは使い方で変わる
国勢調査のデータに限ったことではないですが、データの使い方、読み解き方は様々です。
先ほどの年齢別のグラフをそのまま見て、「人口の多い50歳前後は180万人前後もいるのか~。対して20歳未満は各年齢100万人前後で半分くらいにまで減るのか~」と、いったように実数のデータをそのまま使って読み取ることもあれば、データを加工、集約し、全体における「構成比」を元にデータを読み取ることもあります。
構成比とは、文字通りではありますが、全体を構成する各要素の比率です。
国勢調査では日本国内の人口や世帯を全体として、それを構成する要素を構成比でみることができます。
また、この構成する要素は使うデータやデータの区切り方によって様々で、それによって使い方や読み取り方も変わってきます。
例えば2020年の調査結果から、年代を単純に“10歳刻み”で区分した構成比。

厚生労働白書などでも使用されるような、年齢3区分で見る“生産年齢人口”の構成比。

※年少人口:0~14歳/生産年齢人口:15~64歳/老年人口:65歳以上
ニュースや情報番組などでもよく見かける“Z世代”などの世代で区切った構成比。

※α世代:2010年~生まれ/Z世代:1995~2009年生まれ/Y世代:1980~1994年生まれ/
X世代:1965~1979年生まれ/その他:~1964年生まれ として集計
など、年齢のデータ1つをとっても、様々な区分で様々な意味を持たせることで、異なるデータの見方をすることができるようになります。
◆ 構成される全体と、差と比の錯覚

構成比を見るときには、それが何を全体とした構成比なのかという点にも留意して、その数字の意味を見ていかなければいけません。
先ほど見ていただいた総人口を全体とした際の“10歳刻み”の構成比では、年代間で差はあれども各年代10%前後の構成比で、その差はややなだらかに見えるかもしれません。例えば、総人口においては20代と40代の構成比の“差”は5.2ptです。

一方、20~40代の若年層を全体として絞った場合の“10歳刻み”の構成比では、ぱっと見て差はとても大きく見えるようになり、ここでの20代と40代の構成比の“差”は15.0ptに及びます。

ただ、全体が異なることで20代と40代の構成比の“差”には大きな違いがでましたが、その“比”は、総人口の場合では20代9.3%に対して40代は14.5%で約1.6倍。
20~40代全体の場合は20代26.8%に対して40代は41.8%でこちらも約1.6倍です。
“差”と“比”の話のため構成比に限った話ではありませんが、その数字が何を意味しているのか、どう読み解くのかという経路には、様々な錯覚や落とし穴も潜んでいます。
時にはシンプソンのパラドックスのような結果に混乱してしまうことも出てきます。
データはただそのままでは、事実や事象、数値などを観測、記録した素材や材料のようなもので、そのデータに意味を持たせ、解釈するのはそのデータの活用の仕方次第です。
弊社では、そのデータを公正な視点で収集し、取り扱い、データを活用されるクライアントの皆様が市場に攻勢をかけ、後世につながる商品・サービスを生み出すことのサポートをするために、あらゆる方向性からのご提案、サポート、分析をさせていただければと考えています。
今年の春も、ぜひぜひ素晴らしい出会いがありますように🌸
執筆者プロフィール
リサーチャー T.A
以前まで当社で分析等を担当していましたが、ライフスタイルの変化により、現在働く場所や働き方を変えて勤務中。