※NIリサーチャーコラムでは、当社の各リサーチャーが日々の業務等で感じた事を自由に紹介しています。  

皆さまこんにちは、早いもので2025年も1ヵ月が終わろうとしています。
1年少々前の2023年10月に、当社S.Tが「FA(フリーアンサー)を活用しよう!」というコラムを執筆していましたが、ご覧になった方もいらっしゃるでしょうか。

アンケートデータの集計等を担当している私自身、FA回答を見ていると「そうそう、そうだよね、分かる~」と共感する回答があったり、「なるほど、そういう受け取り方もあるのか」と意外な意見が見つかったりすることがあります。

(分析視点としての)回答の傾向や、件数の多い少ないは別としても、見ていて面白い部分だと思います。

◆FAデータの活用

過去のコラムでは、FA回答の活用について以下のようなご紹介をしていました。 


“性年代別にどんな特色があるのか、職業別では?エリア別では?と思うと、単に目を通していくだけでは見えないこともあります。
その場合は「アフターコーディング」といって、同じような意見をまとめ、MA(マルチアンサー)のように数値として集計することも可能です。
また、「テキストマイニング」のシステムを使い、文字と文字の関連性を示すこともできます。”


今回は、これらの方法によってどのような分析ができるのかを紹介していきたいと思います。

◆アフターコーディングとは

簡単に言えば、FA回答を選択肢化することです。 

様々な意見を自由に記述できるFAの回答から、類似する意見同士をまとめ分類する(コードを付ける)ことにより、数値データとして意見の件数や割合を集計することが可能になります。 

回答データを収集した後(アフター)に、意見の内容ごとに番号を振る(コーディング)ことから、アフターコーディングと言います(あるいは単にコーディング、頭文字をとってACとも)。 

【図①】 FA回答データの例

(当社自主調査:~激動の一年を振り返る~ 2024年の関心事についての自主調査から一部抜粋)

例えば上記のようなFAデータがあったとして、この件数なら見るだけでなんとなく傾向がわかるかもしれませんが、500件、1000件のデータがあれば、とてもではないですが見ただけでは把握できませんよね。  

【図②】回答内容ごとに分類したコード一覧の例(左)/【図③】FA回答1件ずつに対応する番号(コード)を付与した例(右)

FAの回答に対してコードを付与することにより、回答者ごとに自由に記述していた回答が【図②】にある27個の選択肢として分類されました。 

(実際には、当社自主調査の500件を超える回答に使うコードですので、この例ではコードの数が多く感じるかもしれません) 

このように文字データから数値データに変更すると、Excelのピボットテーブルや関数を使用して件数や割合を出すこともできますし、クロス集計表として回答者の性別や年代などの情報と組み合わせて結果を見ることができます。  

【図④】Excelのピボットテーブルで件数を抽出した例

◆アフターコーディングのメリット・デメリット

 アフターコーディングのメリットは、

  • 多種多様な意見(回答)がある中から、多い意見、少ない意見が定量的に可視化できることから、回答の傾向やポジティブ/ネガティブな意見の比率などを容易に把握することが可能になる
  • 他の回答(属性やFAと関連する設問等)とクロス集計を行うことで、より詳細に分析することが可能になる
  • 専用の分析システムを使用せずとも、Excelのみで分析することもできる

といったことが挙げられます。

一方でデメリットとしては、

  • 実際の回答を1件1件分類するため、分析者によって結果(分類基準)に差が生じやすい
  • 設問数や設問内容、サンプル数によっては多大な作業期間を要する

といったことが挙げられます。

ただし、ChatGPTに代表されるAI技術の発展により、アフターコーディングのデメリットが緩和・解消されつつもあり、当社でもAI技術を用いた分析の検証も進めています。

◆テキストマイニングとは

テキストマイニングとは、自由な形式で記述された文章を、自然言語処理の技術により単語や文節に分割して、その出現頻度や相関関係、いつ発言されたものなのかといったことを分析し、有益な情報を探し出す技術のことです。(出典:見える化エンジン)

当社では、プラスアルファ・コンサルティング社の「見える化エンジン」および、ユーザーローカル社の「AIテキストマイニング」による分析サービスを提供しています。

ここでは、先ほどとは別の自主調査(飲酒や生活様式に関する意識実態調査)の回答を例にご紹介します。

FAの質問は、

「今現在、新型コロナウイルスについて、あなたが意識している・気をつけていることはありますか。どのようなことでも結構ですので、できるだけ具体的にお知らせください。」

という内容で、アフターコーディングの例は単語での回答が主でしたが、こちらは文章で回答を求める質問でした。

※新型コロナウイルスの第5類感染症移行後の2023年10月に行った調査のため、現在の情勢とは異なる場合があります

【図⑤】テキストマイニングの分析例1
(当社自主調査データを、見える化エンジン「マッピング」機能による分析)

見える化エンジンによる分析例として、単語同士のつながりを「マッピング」する機能があります。

回答の文章の中で同時に使われることが多いものを線で結ぶことで、単語間の関係性や、文章の内容把握などに使うことができます(共起ネットワークとも言われます)。

【図⑥】テキストマイニングの分析例2
(当社自主調査データを、ユーザーローカル「AIテキストマイニング」による分析)

AIテキストマイニングによる分析例として、「ワードクラウド」を作成する機能があります。
こちらは、出現頻度の多い単語や、重要度(スコア)の高い単語を大きく表示することで、単語の出現傾向を把握することができます。 

※マッピング(共起ネットワーク)、ワードクラウドともに、体裁は異なりますがどちらのプラットフォームでも対応しております

◆テキストマイニングのメリット・デメリット 

テキストマイニングでは、アフターコーディングとは異なり専用のシステム内で自動的に分析することにより、メリットとしては、 

  • 大量のデータを短時間で分析することができる
  • 分析者による結果のブレを減らし、誰が作業しても一定程度の分析結果を導き出せる
  • 単なる件数のカウントだけでなく、単語間の繋がりや、ワードクラウドなど、視覚的に分かりやすい結果を作成したり、多数の分析方法がある
    ※テキストマイニングのプラットフォームによって異なる

といったことが挙げられます。

一方でデメリットとしては、

  • 単語としての分析になるため、表記揺れがあると別の単語として扱われてしまうことがある
    (マッピングの例では、「着用」「着用する」「付ける」が別のものとして分析されています)
  • 文章を途中で分解されてしまうことにより、違う意味になってしまうことがある
    (例えば「味がもう少し薄いほうがいい」という意見があった場合、本来の意見は「味が濃い」という意味なのに、「(味が)薄い」と解釈されてしまう)
  • 回答者の記述をそのまま使うため、誤字・脱字をそのまま分析されてしまうことがある

などがあります。

※辞書登録や除外処理等により、精度を向上することが可能です

◆おわりに 

特にインターネットアンケートでは数千~数万件のFA回答が集まるため、文章そのままのFA回答データだけでは傾向を把握するだけでも大変な労力になることがあります。

アフターコーディングは、専用の集計・分析システムが無くともExcelのピボットテーブル等で分析することもできますし、テキストマイニングもその機能自体は無料で提供しているサービスもあります。

それぞれのデメリットで挙げたように、アフターコーディングは作業に手間が掛かりますし、テキストマイニングは適切な単語分類をしないと正確な結果にならない場合もあります。

当社では、調査実施後にこれらの分析を行った結果をご納品することも可能ですので、ご興味がありましたら是非お問い合わせください。


執筆者プロフィール

学生時代はリサーチやマーケティング全般に全く興味が無かったが、事務職のアルバイトを探していたときにたまたま入社した企業がマーケティングリサーチ会社だったことでこの業界に入る。
途中、飲食業のキッチンや運輸業といった異業種を経つつ、2021年3月より現職。