マトリクス設問の設計と落とし穴 — 認知負荷とストレートライン回答への対策

「マトリクス設問は CSAT も NPS もブランド比較も全部いける万能設問」——これがマトリクスを多用しがちな組織の典型的な誤解です。確かに 少ない設問数で大量の評価を集められる という点でマトリクスは強力な道具ですが、設計を誤った瞬間に認知負荷が爆発し、ストレートライン回答でデータがゴミになる リスクを併せ持っています。

この記事では、マトリクス設問の 基本構造・認知負荷の構造・ストレートライン回答の検知と対策・行列サイズの最適値・編集部の現場運用ルール までを整理します。CSAT/NPS/ブランド評価で必ず使う設問形式なので、何を外すとデータ品質が崩れるか に焦点を当てて書きます。

1. マトリクス設問とは何か

マトリクス設問（matrix / grid question battery）は、複数の評価対象（行）を、共通の評価軸（列）で一度に答えてもらう 設問形式です。

典型例

	とても満足	やや満足	どちらとも言えない	やや不満	とても不満
価格
品質
サポート
配送

このように 「評価される対象を行に並べ、評価尺度を列に並べる」 構造を取ります。Kicue では MTX_SA（各行で1つ選択）、MTX_MA（各行で複数選択）、SCALE（リッカート尺度を行ごとに）といったタイプで提供されます。

マトリクスが選ばれる理由

設問数の圧縮 — 「価格の満足度を教えてください」「品質の満足度を教えてください」…と個別に並べるより画面上のスペース効率がよい
比較しやすさ — 同じ尺度で複数の対象を評価するため、回答者にとっても比較が容易
集計の整然性 — 同じ列構造のため、行間比較・クロス集計がやりやすい

ただし、これらの利便性と引き換えに 認知負荷とデータ品質の問題 がついてきます。

2. なぜマトリクスは便利で危険か — 認知負荷の構造

マトリクスは「効率的に見える設問」ですが、回答者の頭の中では 個別設問よりむしろ重い処理 が走っています。

認知負荷の正体

行間の比較負荷 — 「価格と品質、どっちにより満足してるか」を頭の中で並列処理する必要
列の意味理解 — 5段階や7段階の意味を毎行で再確認する必要
位置記憶 — マトリクスのスクロールで列ヘッダーが消える / 行が密で「自分はどの行を答えていたか」が曖昧になる
疲労蓄積 — 行数が増えるほど比例ではなく 指数的に 認知コストが増える

学術的には、Krosnick (1991) の Response Strategies for Coping with the Cognitive Demands of Attitude Measures in Surveys が、こうした認知負荷状況下で回答者が取る省力化戦略を satisficing（最小努力回答） として理論化しています。マトリクスは satisficing を最も誘発しやすい設問形式の一つとして繰り返し言及されてきました。

行列のサイズと品質の関係

Couper et al. (2013) "The Design of Grids in Web Surveys" では、マトリクスの行数増加と回答品質低下の関係が実証的に示されています。具体的には、6〜8 行を超えると回答時間と完答率の双方が悪化する という観察が複数研究で報告されています。

3. ストレートライン回答（Straight-lining）— 代表的な品質問題

マトリクス設問で最も典型的に発生する品質問題が ストレートライン回答 です。

何が起きているか

ストレートライン回答とは、マトリクスの全行で同じ列を選ぶ 行動パターン。例えば、5段階評価の全項目で「やや満足」を選ぶ、ような状態です。

回答者の動機は次のいずれか：

疲労による省力化 — 内容を読まずに同じ位置を選び続ける
無関心な回答 — そもそも内容を吟味するインセンティブがない
偽装回答（不正回答） — パネル謝礼目的で時間をかけずに通過する

なぜ問題か

ストレートライン回答が混入すると、項目間の差（バリアンス）が消失 します。「価格は不満、品質は満足」のような分布があるはずの設問で、全員「中央」になってしまえば、CSAT スコアもクロス集計もすべて意味を失います。

学術的な検出基準

Yan & Tourangeau (2008) "Fast Times and Easy Questions" や Liu & Cernat (2018) "Item-by-Item Questionnaires vs Grid Questions" では、ストレートライン回答の検出指標として以下が提案されています。

完全一致率（perfect straight-lining） — 全行で同じ列を選んでいる
ほぼ一致率（near straight-lining） — 全行のうち 80%以上で同じ列
行間バリアンス（intra-respondent variance） — 1人の回答者の行間バリアンスがゼロまたは極端に小さい

実務では、複数の指標を組み合わせて「疑わしい回答」をフラグし、集計から除外するか加重を下げる対応が一般的です。

4. マトリクス設問はどう設計するか — 5 つの原則

データ品質を担保するために、設計段階で守るべき原則を 5 つ整理します。

原則1: 行は最大 6〜8 行に抑える

Roßmann et al. (2018) "Item-by-Item vs Grid Layout" を含む複数の実証研究で、6〜8 行を超えると回答品質が顕著に低下 することが示されています。8 行を超える場合は、意味的に近いブロックに分割 して 2 つ以上のマトリクスにする方が、合計時間は伸びても品質は保たれます。

原則2: 列は奇数（5 / 7 段階）を基本に

学術的には Krosnick & Fabrigar (1997) で、リッカート尺度の最適段階数として 5〜7 が頻繁に推奨されています。中央値（neutral）の存在が回答負担を軽減する 一方、9 段階以上は識別困難で品質低下を招きます。

原則3: 行と列の意味的距離を一定に保つ

行に「価格・品質・サポート」といった異質なカテゴリ を並べるのと、「ボタンの配置・色・サイズ」のような 同質な細目 を並べるのとでは、認知負荷が全く異なります。行同士の意味的距離が大きいほど比較負荷が増える ため、異質カテゴリのマトリクスは行数を絞るのが鉄則です。

原則4: 行のランダマイズを基本設定にする

回答者が上から順に処理すると 順序効果（primacy effect / order effect） が発生し、最初の行ほど慎重に答え、後ろの行ほど省力化される傾向があります。行の表示順をランダマイズする だけで、この順序効果を統計的に均すことができます。学術的には Tourangeau, Rips & Rasinski (2000) The Psychology of Survey Response で、順序効果対策としてランダマイズが推奨されています。

原則5: モバイルでの表示を必ず確認する

PC ではきれいに見える 7 列マトリクスが、スマホでは 横スクロール地獄 になり、列ヘッダーが消えた状態で回答が進む——これが Web アンケートで最も頻発するモバイル品質事故です。Toepoel et al. (2009) "Design of Web Questionnaires" では、モバイル端末でのマトリクス表示が回答品質に与える影響が実証的に分析されています。モバイル比率が 30% を超えるなら、マトリクスを使わず項目別設問に分解する 判断も視野に入れるべきです。

5. 行数・列数の最適値 — 学術データのまとめ

設計の出発点として、複数研究を総合した「無難な設定」を表にまとめます。

項目	推奨値	根拠
行数	5〜8 行	Roßmann et al. (2018), Couper et al. (2013)
列数	5 または 7 段階	Krosnick & Fabrigar (1997)
中央値	含める	回答負担と中立的回答の権利確保
行ランダマイズ	推奨	Tourangeau et al. (2000) の順序効果対策
モバイル想定	5 列以下	Toepoel et al. (2009)
1 マトリクスの想定回答時間	30〜60 秒	Yan & Tourangeau (2008)

「行 × 列 = 想定セル数」という指標で言うと、5×5 = 25 セルあたりが品質の境界線 で、それを超えるなら「分割」「個別設問化」「ランダム抽出（行サブセット表示）」のいずれかを検討すべき、というのが業界記事と学術研究の総合的な見解です。

6. 編集部の視点 — マトリクス運用で必ず効く 5 つの実践

業界記事と公開事例を追ってきた立場から、ここは強めに言っておきたい原則を 5 つ書きます。

1. 行数の上限を社内ルール化する。 「8 行まで」「これを超えるなら分割」というルールを社内設計プロセスに明文化するチームと、毎回設計者の裁量に任せるチームでは、データ品質に大きな差が出ます。ルール化していない組織は、必ず 12 行・15 行のマトリクスを発行してしまう のが業界記事で繰り返し見るパターンです。

2. ストレートライン検知を「集計後の事後対策」だと思わない。 ストレートライン検知は 発行前の設計段階から織り込むべき 仕組みです。「集計時にフィルタすればいい」と思っていると、フラグ対象が全体の 20〜30% に達して分析母集団が崩壊する 事故が起こります。設計段階で「ストレートライン率 5% 以下を目標」と置き、超えた場合の設計修正パターンも事前に決めておくのが鉄則です。

3. モバイル比率を必ず先に確認しろ。 B2C アンケートでモバイル比率が 70% を超える環境で、PC を前提にした 7 列マトリクスを発行すると、完答率が 50% を切る 事故が普通に起きます。モバイル比率を最初の 1 時間で確認し、それに応じて設計の選択肢を狭めるのが安全です。

4. 「項目別設問への分解」を恐れない。 マトリクスで 10 行入れるより、個別設問 10 問に分解した方が品質が高い ことは複数の実証研究で示されています（Liu & Cernat 2018）。設問数が増えるのは怖いですが、満たすべきは「設問数の少なさ」ではなく「データ品質」 です。総回答時間で見ても、マトリクスより個別設問の方が早く終わるケースすらある、というのが学術的な観察です。

5. マトリクスは「重要 KPI 系」より「網羅型・スクリーニング後の追加質問」で使う。 NPS や CSAT のような 意思決定に直結する KPI をマトリクスの中に埋め込むのは危険です。マトリクス内の設問は周辺項目（質問疲労が起きてからの追加情報）として扱う のが安全側の設計判断です。重要 KPI は単独設問として独立画面で聞き、マトリクスは「付随属性の比較・把握」に限定するのが、業界記事でも繰り返し推奨される運用パターンです。

7. アンケートツール Kicue でのマトリクス運用

Kicue では、マトリクス設問の運用に必要な機能を標準で備えています。

マトリクス設問タイプ

マトリクス設問タイプとして MTX_SA（各行で1つ選択）、MTX_MA（各行で複数選択）の 2 種類を提供。さらにスケール設問として LIKERT / NPS / SLIDER / SD があり、リッカートマトリクスを構築できます。

ストレートライナー検知

Kicue はストレートライナー検知機能を標準搭載。マトリクス設問の全行で同じ列を選んでいる回答や、行間バリアンスが極端に小さい回答を自動でフラグします。フラグ済みデータは集計除外も可能で、データ品質の確保がそのまま分析にもつながります。

選択肢ランダマイズ

選択肢ランダマイズ機能で、マトリクスの行表示順をランダマイズできます。順序効果対策として推奨される設定です。

実装ツールの選び方

マトリクス設問は ツールによって扱いが大きく異なります: Google Forms / Microsoft Forms は基本的なマトリクスのみ、Tayori の無料プランは条件分岐との組み合わせ不可、Typeform は専用 UI で実装、など。さらにモバイル表示時の自動レイアウト変換も対応有無が分かれます。各ツールの対応状況は無料アンケートツール 8 選比較を参照してください。

まとめ

マトリクス設問の設計と運用のチェックポイント:

マトリクスは効率的に見えて、回答者には個別設問より重い — 認知負荷は行数に対して指数的に増える
ストレートライン回答が最大の品質リスク — 設計段階から検知と対策を織り込む
行数は 5〜8、列数は 5〜7 段階を基本 — 学術研究で繰り返し推奨される設計値
行のランダマイズで順序効果を均す — 単なる便利機能ではなく品質要件
モバイル比率が高いなら個別設問への分解を選ぶ — 「マトリクスを使わない判断」も設計の一部
マトリクスは重要 KPI ではなく周辺項目に使う — NPS/CSAT のような意思決定 KPI は単独設問で

「マトリクスは万能設問」と思っているチームほど、データ品質で痛い目を見るのがリサーチ実務の経験則です。マトリクスは便利だが危険な道具——使う場面と使わない場面の判断を、設計プロセスにルールとして組み込むことが、データ品質の生命線 になります。

参考文献 (14件)

学術・方法論

Krosnick, J. A. (1991). Response Strategies for Coping with the Cognitive Demands of Attitude Measures in Surveys. Applied Cognitive Psychology.
Tourangeau, R., Rips, L. J., & Rasinski, K. (2000). The Psychology of Survey Response. Cambridge University Press.
Couper, M. P., Tourangeau, R., Conrad, F. G., & Zhang, C. (2013). The Design of Grids in Web Surveys. Social Science Computer Review.
Yan, T., & Tourangeau, R. (2008). Fast Times and Easy Questions: The Effects of Age, Experience and Question Complexity on Web Survey Response Times. Public Opinion Quarterly.
Roßmann, J., Gummer, T., & Silber, H. (2018). Mitigating Satisficing in Cognitively Demanding Grid Questions: Evidence from Two Web-Based Experiments. Journal of Survey Statistics and Methodology.
Liu, M., & Cernat, A. (2018). Item-by-Item Questionnaires vs Matrix Questions: A Web Survey Experiment. Social Science Computer Review.
Toepoel, V., Das, M., & van Soest, A. (2009). Design of Web Questionnaires: The Effects of the Number of Items per Screen. Public Opinion Quarterly.
Krosnick, J. A., & Fabrigar, L. R. (1997). Designing Rating Scales for Effective Measurement in Surveys. Survey Measurement and Process Quality.

業界ベンダー・実務ガイド

国内リサーチ会社の公開知見（業界説明として参照）

マトリクス設問の設計からストレートライナー検知までを一気通貫で実施できる無料のアンケートツール Kicue を試してみませんか。MTX_SA / MTX_MA / SCALE 設問タイプ、ストレートライナー検知、行ランダマイズが標準搭載で、マトリクス設計の品質ルールがそのまま運用に乗ります。