ノウハウ

アンケート Excel 集計 — CSV からカイ二乗検定まで 5 ステップ

アンケートツールから CSV をダウンロードして Excel で集計するまでの実務フローを 5 ステップで整理。UTF-8 文字化け対策、ピボットテーブルでの GT・クロス集計、CHISQ.TEST 関数によるカイ二乗検定、グラフ化と社内共有まで、30 分で 1 本のレポートを完成させる手順を解説する。

アンケートツールから CSV をダウンロードして Excel で集計してレポートにする——リサーチ運用で最頻度の作業ですが、ピボットテーブルのフィールド設定ミス、UTF-8 文字化け、CHISQ.TEST 関数の引数誤り で 1〜2 時間ロスする現場をよく見ます。本稿では、CSV を Excel に取り込む手順から、GT 集計・クロス集計・カイ二乗検定・グラフ化までを 30 分で完了させる 5 ステップ で整理します。

各 Step に「ここで失敗する人が多い」注意点と、さらに深掘りするための専門記事へのリンクを併記します。

Step 1: CSV を Excel に取り込む(UTF-8 文字化け対策)

CSV を Excel で扱う最初のハードルは 日本語の文字化け です。CSV ファイルを ダブルクリックで直接開く と、UTF-8 BOM なしのファイルでは「?」やランダムな漢字に化けます。必ず「データの取り込み」経由で開きます。

手順:

  1. Excel を起動 → 「データ」タブ → 「テキスト/CSV から」を選択
  2. CSV ファイルを選択
  3. 元のファイル: 「65001 : Unicode (UTF-8)」を指定
  4. 区切り記号: 「コンマ」を選択
  5. データ型検出: 「ファイル全体」を推奨
  6. 「読み込み」をクリック

ここで失敗する人が多い: ダブルクリックで直接開いて文字化け → 再ダウンロード → 再度ダブルクリック の無限ループに陥る。最初から「データの取り込み」経由を習慣化することで防げます。

詳細は アンケートのデータクリーニング完全ガイド で、取り込み後の不正回答検出(ストレートライナー / スピーダー)の実務を整理しています。

Step 2: GT 集計をピボットテーブルで作る

GT 集計(全体集計)は「各設問の選択肢ごとの回答数と比率」を出す基本作業です。ピボットテーブルで一発で作れます。

手順:

  1. データ範囲を選択 → 「挿入」→「ピボットテーブル」→「OK」
  2. 集計したい設問列を 「行」エリア にドラッグ
  3. 同じ設問列を 「値」エリア にドラッグ(自動的に件数カウント)
  4. 値フィールドの設定 → 「計算の種類」→「列集計に対する比率」で % 表示
  5. 「行ラベル」を右クリック → 「並べ替え」で件数降順に

ここで失敗する人が多い: 複数回答(MA)設問が 1 列にカンマ区切りで入っている 場合、ピボット集計が機能しない。事前に「データ」→「区切り位置」で複数列に展開してから集計するか、Kicue 等のツール側で MA を分割列でエクスポートする設定を確認します。

Step 3: クロス集計(属性 × 設問)を作る

クロス集計は 2 つの設問の関係性 を見る集計で、リサーチでの意思決定に最も使われます。例: 「年代別に満足度はどう違うか」。

手順:

  1. 新しいピボットテーブルを作成(同じデータ範囲)
  2. 「行」: 属性設問(例: 年代)
  3. 「列」: 評価設問(例: 満足度)
  4. 「値」: 件数(任意の列をドラッグして「個数」を選択)
  5. 値フィールドの設定 → 「計算の種類」→ 「行集計に対する比率」 で行 % 表示

これで「年代別の満足度分布」が % で見えます。

ここで失敗する人が多い: N が小さいセル(N < 30)の % を見て一喜一憂する。「40 代の満足度が 80%」と言っても N=5 なら誤差が大きく、意思決定の根拠にならない。N と %を併記する習慣 が必須です。

詳細は アンケート集計と有意差判定 — クロス集計・カイ二乗検定・効果量の使い方 で、クロス集計で見るべき 5 パターンを整理しています。

Step 4: カイ二乗検定(CHISQ.TEST 関数)

クロス集計で「差がありそう」と思ったら、統計的に有意な差なのか偶然のばらつきなのか をカイ二乗検定で判定します。Excel の CHISQ.TEST 関数で実行できます。

手順:

  1. クロス集計の 観測値 を別シートにコピー(行 / 列の小計セルは除外、本体のセルのみ)
  2. 同じ大きさの 期待値 マトリクスを作成。各セルは =ROUND(行合計*列合計/総計, 2)
  3. CHISQ.TEST 関数を実行: =CHISQ.TEST(観測値範囲, 期待値範囲)
  4. 結果(p 値)が出る
  5. p 値 が 0.05 未満なら統計的に有意差あり と判断

例: =CHISQ.TEST(B2:D4, F2:H4) → 結果が 0.023 なら「年代別の満足度差は統計的に有意」

ここで失敗する人が多い: 期待値計算を忘れて 観測値範囲を 2 つ並べる誤用。CHISQ.TEST は「観測値範囲」と 「期待値範囲」 の 2 つを要求する関数です。観測値だけを渡すと意味のない数値が返ります。

また p 値だけで判断しない こと。サンプルサイズが大きいと小さな差でも有意になるため、効果量(Cramér's V)と合わせて見るのが学術標準です。詳細は同じく アンケート集計と有意差判定ガイド で、効果量の計算と解釈を整理しています。

Step 5: グラフ化と社内共有

集計値をそのまま PPT / Word に貼っても伝わりません。設問タイプ別に最適なグラフ を選び、レポートに整形します。

設問タイプ別の最適グラフ:

  • 単一回答(SA): 棒グラフ(横棒推奨)
  • 複数回答(MA): 棒グラフ
  • リッカート尺度: 発散積み上げ棒グラフ(divergent stacked bar)
  • クロス集計: グループ棒グラフ / モザイクプロット
  • 時系列: 折れ線グラフ

整形の最低条件:

  • 軸ラベル・凡例・タイトル・データソースを必ず付ける
  • 各グラフに N= を併記
  • カラーは 3 色以内に絞る(背景色含む)

ここで失敗する人が多い: 円グラフを 5 セグメント以上で使う。視覚的に比較困難になり、読み手の認知負荷が上がる。5 セグメント超は棒グラフが標準です。

詳細は アンケート結果の可視化ガイド で、設問タイプ別の最適グラフと避けるべき 5 つの危険パターンを整理しています。

編集部の視点 — Excel 集計を効率化する 3 点

業界事例と実務担当者の声を継続的に追っている立場から、Excel 集計を効率化する 3 点。

  1. テンプレートシートを作る: GT 集計・クロス集計・カイ二乗のひな型を Excel テンプレ化し、次回プロジェクトからは データだけ差し替える 運用にする。毎回ゼロから作ると 30 分が 2 時間に膨らみます。
  2. 生データシートは絶対に編集しない: 計算・グラフ作成は別シートで実施し、生データはバックアップ用に保持。誤って生データを上書きすると復旧不能になる事故が頻発します。
  3. 集計結果に「N=」を必ず併記: 「満足 60%」より「満足 60%(N=120)」の方が読み手の判断材料になる。サンプル数が小さい結果は誤解を招くため、N の併記は最低限のリテラシーです。

アンケートツール Kicue での CSV エクスポート

Kicue の CSV エクスポートは、本ガイドの Excel 集計フローに乗せやすい形式で出力されます:

  • UTF-8 文字コード: Excel への取り込みで文字化けが起きにくい構造
  • 列ヘッダーに設問文を含む: 1 行目から人間可読、設問 ID を別途引く必要がない
  • 回答者 ID 列: クロス集計の属性結合や、追加インタビュー候補抽出(特定セグメントの回答者抽出)に活用可能
  • 設問別の独立列: ピボット集計が直接できる構造

複数回答(MA)の出力形式は設問設計時の設定に依存するため、ピボット集計前に Step 2 の区切り位置による列分割 が必要なケースがあります。本記事の手順で対応可能です。

なお、カイ二乗検定 や 効果量計算は Excel 標準機能 / R / Python / SPSS / JASP で実施するのが現実的で、Kicue 自体には統計解析機能は提供していません。CSV エクスポート → 外部ツール というワークフローを前提に設計されています。

まとめ — 30 分で 5 ステップ

これで 30 分でレポートの土台が完成します。次に踏むべきは テンプレ化生データ保護 の運用設計です。


CSV を Excel で集計しやすい形でエクスポートしたい方は、無料のアンケートツール Kicue を試してみませんか。UTF-8 で取り込みやすい CSV エクスポート、回答者 ID 列を含む構造化データ、設問別の独立列構成で、本ガイドの Excel 集計 5 ステップを 1 アカウントで開始できます(高度な統計解析・効果量計算・Joint Display 作成は R / Python / SPSS / JASP との組み合わせ運用となります)。

参考文献 (1件)

関連記事

ノウハウ

アンケートの設問数は何問が適切か — 離脱を防ぐ長さの決め方

アンケートの設問数は何問が適切か。結論は「5分・15問前後」を目安に、目的から逆算して削ること。設問数が増えると回答率と回答品質が落ちる理由、適切な長さを決める5ステップ、離脱を防ぐ削り方を、Galesic & Bosnjak (2009) などの研究と実務の勘所で解説する。

ノウハウ

アンケート公開前チェックリスト — 5 項目で配信ミスを潰す

アンケート本配信後の手戻りは 1〜2 週間のロスに化ける。設問品質・分岐動作・モバイル実機・パイロット配信・最終配信設定の 5 項目を 30 分でチェックする実践フローを、専門記事の深掘りリンクとあわせて整理する。

ノウハウ

コンセプトテスト調査ガイド — 発売前に受容性を測る設計

新商品・新機能・広告コピーを発売前にアンケートで評価するコンセプトテストの設計を解説。モナディック・順次モナディック・比較提示の使い分け、購入意向・新規性・好意度・独自性という標準指標、トップボックスの読み方、ノルム(基準値)比較の重要性、刺激(コンセプト文)の作り込みまで、実務の勘所で整理する。PSM・コンジョイント・MaxDiff の前段に位置づく発売前調査の入口。

Kicue でアンケートを作ってみませんか?

調査票をアップロードするだけで、AIが30秒でWebアンケートを自動生成します。

無料で始める