「同じことを聞いているはずなのに、設問文を書き直しただけで回答分布が変わってしまった」——これは設問品質を本気で詰めたことのあるリサーチャーなら、一度は遭遇する現象です。設問文の書き方ひとつで、データは平気で 10〜30 ポイント単位で動きます。にもかかわらず、設問文の品質チェックは「なんとなく読みにくくないか」レベルで終わってしまうケースが多い。
本稿では、設問文の品質が回答に与える影響の構造、現場で頻発する 7 つの危険パターン、認知の 4 段階モデルに基づくリライトの考え方、そして編集部が必ず見るレビュー観点 を整理します。スクリーニング設問・リッカート尺度・自由記述といった設問タイプ別の設計記事と並ぶ「文章としての設問」の品質を底上げするための一本です。
1. 設問文の品質が回答品質を決める理由
設問文は単なる質問の表記ではなく、回答者が「何を聞かれているか」を解釈する唯一のインターフェース です。回答者の頭の中では、Tourangeau, Rips & Rasinski (2000) が定式化した認知の 4 段階(理解 → 検索 → 判断 → 報告)が走っています。設問文がこの 4 段階のどこかで負荷をかけると、回答は意図とずれた方向に歪みます。
設問文の劣化が起こす 3 つの帰結
- 測定誤差の拡大 — 同じ意図でも聞き方が違えば異なる回答が返る(measurement error)
- 回答者の satisficing(手抜き回答) — Krosnick (1991) が示すように、認知負荷が高すぎると人は最も楽な選択肢を選ぶ
- データの再現性が消える — 同じ調査を後日繰り返しても結果が再現しない
Schwarz (1999) Self-reports: How the questions shape the answers は、設問文の文言・順序・選択肢の構造が回答そのものを構成すると論じており、設問設計を「測定の前段階」ではなく「測定そのもの」として扱う必要性を強調しています。
2. 現場で頻発する 7 つの危険パターン
業界・学術の調査文献を横断すると、設問文の落とし穴は概ね 7 つに集約されます。
パターン1: ダブルバレル質問(一度に 2 つのことを聞く)
「商品の品質と価格には満足していますか?」のように、1 つの設問で 2 つの異なる対象を聞く タイプ。回答者は片方にしか満足していないとき、どう答えるか迷います。Belson (1981) The Design and Understanding of Survey Questions でも、ダブルバレルは「最も頻発する設問エラー」とされています。
パターン2: 誘導質問(leading question)
「多くの専門家が推奨する◯◯について、あなたはどう思いますか?」のように、回答の方向を事前に示唆する文言 が混ざるパターン。中立を装った文章でも「専門家」「調査によれば」といった枕詞が回答を誘導します。
パターン3: 二重否定
「◯◯がない場合に、不便を感じないとは限らない」のような 否定の連鎖。読み手は文意を逆方向に再構成する必要があり、認知負荷が一気に跳ね上がります。
パターン4: 専門用語・ジャーゴン
業界用語、社内用語、英略語が無加工で出てくるパターン。「KPI」「PMF」「DAU」「OKR」といった用語は B2B 調査ですら回答者によって理解度の差が大きく、誤回答や離脱の原因になります。
パターン5: 仮定の埋め込み(loaded question)
「最近上がった物価について、生活への影響は?」のように、前提を当然のものとして埋め込む パターン。回答者が前提に同意していない場合、回答そのものが意味をなしません。
パターン6: 曖昧な時制 / 期間指定
「最近◯◯したことがありますか?」の「最近」が、回答者によって 1 週間〜半年と幅広く解釈されるパターン。「過去 3 ヶ月以内」「直近 1 年で」など、期間を必ず明示 する。
パターン7: 呼びかけ・人格化(personalization)
「あなたは責任あるユーザーとして◯◯しますか?」のように、特定の人格イメージを呼び出す パターン。社会的望ましさバイアス(詳細は前回記事を参照)を強く誘発します。
3. Tourangeau の認知 4 段階モデル — どこで歪みが入るか
リライトの実践に入る前に、設問文がどの段階で誤読されるかを整理しておきます。
| 段階 | 中身 | 設問文側の責任 |
|---|---|---|
| 1. 理解 | 質問が何を聞いているかを把握する | 文章の単純さ、語彙、時制、対象範囲 |
| 2. 検索 | 関連する記憶・情報を呼び出す | 期間指定、対象の具体性 |
| 3. 判断 | 思い出した内容を質問に合うよう整える | 選択肢の構造、尺度の段階数 |
| 4. 報告 | 最終的な回答を選ぶ | 社会的望ましさ・Yea-Saying の管理 |
ダブルバレルは段階 1 で躓き、誘導質問は段階 3 を歪め、社会的望ましさバイアスは段階 4 で発生する——という形で、「どの段階で誤りが入るか」を意識すれば、対策の優先順位がつけられます。
4. リライト実践 — before / after で見る修正例
例1: ダブルバレル → 分割
Before: 「商品の品質と価格に満足していますか?」 After:
- Q1.「商品の 品質 に満足していますか?」(5段階)
- Q2.「商品の 価格 に満足していますか?」(5段階)
例2: 誘導質問 → 中立化
Before: 「環境保護のために多くの企業が導入している◯◯について、賛成ですか?」 After: 「◯◯について、あなたはどの程度賛成または反対ですか?」(7段階リッカート)
例3: 二重否定 → 単純肯定
Before: 「◯◯機能が ない場合 に、業務に 不便を感じない とは限らない、に同意しますか?」 After: 「◯◯機能があると、業務の効率は上がりますか?」(5段階)
例4: 仮定の埋め込み → 前提の確認を分離
Before: 「最近上がった物価について、生活への影響は?」 After:
- Q1.「直近 1 年間で、あなたの生活費は変化しましたか?」(上昇 / 変化なし / 下降)
- Q2.(上昇と回答した人だけに)「生活への影響を、どの程度感じていますか?」
例5: 曖昧な時制 → 期間明示
Before: 「最近、外食しましたか?」 After: 「直近 7 日間 に、外食を 1 回以上しましたか?」(はい / いいえ)
例6: 専門用語 → 平易な表現
Before: 「貴社の DAU はどの程度ですか?」 After: 「貴社のサービスについて、1 日あたりの利用者数(過去 30 日の平均) はおおよそどの程度ですか?」
5. 多言語化での落とし穴
設問文を翻訳する際、直訳で原文の認知負荷をそのまま増幅させる ケースが頻発します。
- 英語の二重否定("not unlike")を日本語で直訳すると、否定が 3〜4 重になることがある
- 「最近」「ふだん」のような曖昧時制は、言語ごとに想起されるデフォルト期間が異なる
- 敬語・丁寧表現の差で、同じ尺度でも回答分布が変化する(特に日本語・韓国語)
国際比較を前提とする調査では、バックトランスレーション(逆翻訳)と認知インタビュー を組み合わせ、原文の「読み手の負荷」が言語間で揃っていることを確認するのが標準的な品質保証手続きです。
6. 編集部の視点 — レビュー時に必ず見る 5 項目
業界文献と現場運用を踏まえ、編集部としてレビュー時に必ずチェックする 5 項目を整理しました。
1. 1 設問 = 1 概念の原則を毎回確認する。 ダブルバレルは設問文を書いた瞬間には気づきにくく、後から分布を見て初めて発覚することが多い。「この設問は何の判断を求めているか」を 1 文で書けない場合、ほぼダブルバレル と疑って分割するのが安全側です。
2. 設問文を音読してみる。 読み上げて 8 秒以内に意味が取れない設問は、回答者が黙読しても理解できません。長い修飾節、二重否定、専門用語のチェックは、音読が最速の検出器です。
3. 「期間」と「対象」は必ず明示する。 「最近」「ふだん」「あなたの周りで」のような曖昧表現は、回答者ごとに想起する範囲が大きくぶれます。過去 7 日 / 過去 30 日 / 過去 12 ヶ月 のような明示的な期間に置き換えるだけで、回答の安定度が大きく上がります。
4. 専門用語と社内用語の濫用を疑う。 「KPI」「PMF」「DAU」など、業界では当然視される用語ほど誤解を招きやすい。B2B 調査でも、最低でも 1 行の補足を入れる か、平易な言い換えに置換するのが安全策です。
5. パイロット調査での「自由記述コメント」を読む。 本配信前のパイロット(N=30〜50)で、最後に「答えにくかった設問はありましたか?」と聞くと、設問文の落とし穴は驚くほど高い精度で発掘できます。机上で全部潰すよりも、パイロットで現実の認知負荷を測る ほうが早いです。
7. アンケートツール Kicue での設問品質チェック
Kicue では、設問文の品質チェックを支える機能が標準で揃っています。
設問プレビューと表示の事前確認
すべての設問は プレビュー機能 でモバイル / デスクトップ両方の表示を即時確認できます。設問文の改行や折り返しが回答に与える影響を、配信前に視覚化できます。
スキップ・キャリーフォワードでの「仮定の分離」
「前提を聞く設問」と「前提を踏まえて聞く設問」を スキップロジック と キャリーフォワード で分離できます。これは本記事のリライト例 4(仮定の埋め込み)の対策そのものです。
パイロット運用とクォータ分離
クォータ管理 で N=30〜50 の小規模パイロットを別バケットで配信し、本配信用バケットを別途用意する運用が可能です。設問文の検証 → 修正 → 本配信のループを 1 つのフォームで完結できます。
実装ツールの選び方
設問文の自動チェック AI(ダブルバレル検出 / 誘導文言検出 / wording 改善提案)を備えるツールは限られます。Typeform AI / SurveyMonkey Genius AI / Kicue が代表的ですが、無料プランでの利用可否はそれぞれ異なります。各ツールの AI 機能対応は 無料アンケートツール 8 選比較 で整理しています。
まとめ
設問文の書き方をチェックリスト化:
- 設問文は測定の前段階ではなく、測定そのもの — 文言が回答を構成する。
- 7 つの危険パターン: ダブルバレル / 誘導質問 / 二重否定 / 専門用語 / 仮定埋め込み / 曖昧時制 / 人格化呼びかけ。
- Tourangeau の 4 段階モデル(理解 → 検索 → 判断 → 報告)で、どの段階に歪みが入るか特定する。
- 5 つの編集部レビュー観点: 1 設問 = 1 概念 / 音読チェック / 期間と対象の明示 / 専門用語の検証 / パイロットの自由記述確認。
- 多言語化ではバックトランスレーションと認知インタビュー を組み合わせて、認知負荷を言語間で揃える。
設問文の品質は、N=1000 集めても N=200 集めても、最終的な意思決定の質を決める分母になります。設問文を書き直す数十分が、後段の分析数日分の手戻りを防ぐ 投資です。
参考文献 (8件)
学術・方法論
- Tourangeau, R., Rips, L. J., & Rasinski, K. (2000). The Psychology of Survey Response. Cambridge University Press.
- Schwarz, N. (1999). 自己報告:質問が回答を形作る仕組み. American Psychologist, 54(2), 93–105.
- Krosnick, J. A. (1991). 態度測定における認知負荷への対処戦略. Applied Cognitive Psychology.
- Belson, W. A. (1981). The Design and Understanding of Survey Questions. Gower.
- Saris, W. E., & Gallhofer, I. N. (2014). Design, Evaluation, and Analysis of Questionnaires for Survey Research. Wiley.
業界ガイド(業界観察として参照)
設問文の品質チェックを設計の段階から運用に乗せたい方は、無料のアンケートツール Kicue を試してみませんか。設問プレビュー・スキップロジック・キャリーフォワード・クォータでのパイロット運用が標準搭載で、設問文のリライトサイクルがそのまま本配信につながります。
