コンセプトテスト調査ガイド — 発売前に受容性を測る設計

新商品の企画が3つに絞られた。会議室では声の大きい人の推しと、役員のお気に入りが残っている。でも、それを買うのは会議室の人たちではありません。発売してから「売れませんでした」と気づくのは、いちばん高くつく失敗です。

コンセプトテストは、アイデアを世に出す前に、ターゲット顧客に「これ、どう?」と聞く調査 です。やることは単純に見えて、設計を一つ間違えると数字が嘘をつきます。「全部のコンセプトが購入意向70%超え」——よくある光景ですが、これは提示方式を間違えた典型的な失敗です。本稿では、提示方式の使い分けから、測るべき標準指標、トップボックスの読み方、そして「自社の数字は高いのか低いのか」を判断するためのノルム比較までを、実務の手触りで整理します。

1. コンセプトテストとは — 一番高い失敗を避ける投資

コンセプトテストは、製品・サービス・機能・広告などの コンセプト（まだ実物がない段階のアイデア） を、ターゲット顧客に提示して受容性を評価する調査です。目的は2つあります。

Go / No-Go の判断: そもそも世に出す価値があるか。複数案のどれを進めるか
改善点の発見: コンセプトのどこが刺さり、どこが響かないか

最大の価値は 「作る前に分かる」 こと。プロトタイプ開発・在庫・広告出稿の前に方向性を検証できれば、失敗のコストが桁違いに小さくなります。逆に言えば、ここで雑な調査をして「行ける」と誤判断すると、最も高い失敗——市場に出してからの撤退——を招きます。

なお、コンセプトテストは 「いくらで売るか」の前段 です。受容性を確認した後に、Van Westendorp 価格感度メーター（PSM）やコンジョイント分析で価格・機能の最適な組み合わせを詰め、MaxDiff で訴求要素の優先順位を測る。コンセプトテストは、この発売前調査クラスタの入口にあたります。

2. 提示方式の使い分け — モナディック / 順次モナディック / 比較

コンセプトテスト最大の設計判断が 「どう見せるか」 です。提示方式で結果が大きく変わります。ここを間違えると、冒頭の「全部70%超え」や逆に「全部低い」が起きます。

コンセプト提示の3方式

モナディック（Monadic）— 1人1案だけ

回答者を案ごとに分け、各人は1つのコンセプトだけを深く評価する。最も純粋（バイアスが少ない）で、現実の購買状況に近い。弱点: 案の数だけサンプルが要る（3案なら3倍）。本命の意思決定はこれ。

順次モナディック（Sequential Monadic）— 1人が複数案を順に

1人が複数案を1つずつ順番に評価する。サンプル効率が良い。弱点: 後の案が前の案と比較されてしまう（順序効果）。提示順をランダム化して緩和する。実務で最も多い折衷案。

比較提示（Comparative / Competitive）— 複数案を並べて

複数案を同時に並べて「どれが一番良いか」を選ばせる。案間の相対的な優劣は鮮明に出る。弱点: 全部並べると差が誇張され、絶対的な受容度（市場で本当に売れるか）は分からない。スクリーニング向き。

使い分けの原則

最終的な Go / No-Go の判断 → モナディック: サンプルは食うが、現実の購買（人は店頭で1案ずつ出会う）に最も近く、絶対水準を読める
サンプルが限られる → 順次モナディック + 提示順ランダム化: 現実的な折衷。順序効果は順序効果と設問順設計の知見でランダム化必須
多数の案から数案に絞る一次スクリーニング → 比較提示: 相対順位だけ見たいとき

「比較提示で全案を見せて高評価が出た」を絶対水準だと誤読しない。 並べると差が誇張され、実際の市場（1案ずつ出会う）とはかけ離れます。

3. 何を測るか — コンセプトテストの標準指標

測る指標は、業界で概ね固まっています。最低限おさえるべきは次の5つです。

購入意向（Purchase Intent）: 「発売されたら買いたいと思いますか」。5段階（「絶対買う」〜「絶対買わない」）が標準。最重要指標
新規性 / 目新しさ（Uniqueness / Newness）: 「今までにない新しさを感じますか」。新規性が低いと、既存品から乗り換える理由がない
好意度（Appeal / Liking）: 「全体としてどのくらい魅力を感じますか」。第一印象の総合評価
関連性 / 自分ごと度（Relevance）: 「あなたのニーズに合っていますか」。新規性が高くても自分に関係なければ買わない
独自性 / 差別化（Differentiation）: 「他の商品と違うと思いますか」

新規性 × 関連性のバランス

特に重要なのが 新規性と関連性のトレードオフ です。

新規性は高いが関連性が低い → 「面白いけど、自分には関係ない」。話題にはなるが売れない
関連性は高いが新規性が低い → 「便利そうだけど、今あるもので足りる」。乗り換えが起きない
両方高い → 理想。新しくて、かつ自分に必要

購入意向だけ見て一喜一憂せず、「なぜその購入意向なのか」を新規性・関連性で分解 すると、改善の方向（新しさを足すのか、自分ごと化を足すのか）が見えます。

4. トップボックスの読み方 — 数字を割り引く作法

購入意向の集計では トップボックス（Top Box）/ トップ2ボックス（Top 2 Box, T2B） を使います。5段階なら「絶対買う」=トップボックス、「絶対買う + たぶん買う」=T2B です。

購入意向は必ず上振れする

ここが最大の落とし穴です。アンケートの購入意向は、実際の購買行動より必ず高く出ます。 「買いたい」と答えるのはタダだからです。「絶対買う」と答えた人の実購買率が、その数字どおりになることはまずありません。

実務では 「絶対買う」を重く、「たぶん買う」を大きく割り引く のが定石です。業界によっては「T2B の何割が実購買」という換算係数（過去の実績から作る自社係数）を持っていますが、これは商材・価格帯で大きく変わるため、他社の係数を借用しても当たりません。

だから「ノルム比較」が必要（次章）

割り引くにしても、「割引後の数字が高いのか低いのか」を判断する基準 が要ります。それがノルムです。

5. ノルム比較 — 「70%」が高いか低いかは単体では分からない

コンセプトテストで最もよくある誤りが、スコアの絶対値だけを見て判断する ことです。「購入意向 T2B が 65%、これは高い」——本当でしょうか。

購入意向の水準は、カテゴリ・価格帯・調査手法で大きく変わります。日用品の新フレーバーなら T2B 70% は平凡でも、高額耐久財なら 40% で優秀かもしれない。同じ調査設計で測った過去案・競合・カテゴリ平均（=ノルム / 基準値）と比べて初めて、「高い / 低い」が言えます。

ノルムの作り方・使い方

自社の過去案を同じ設計で蓄積する: 最も信頼できるノルム。成功した過去商品・失敗した過去商品のスコアを基準線にする
同一調査内に「アンカー」を仕込む: テスト案と一緒に、既存の自社ヒット商品や競合品も同じ設問で評価させる。これで「新案は既存ヒットと比べてどうか」が同一条件で分かる
市場調査会社のノルムDBを使う: BASES（NielsenIQ）などの商用ノルムDBは、カテゴリ別の基準値を持つ。ただし手法依存なので、その会社の手法で測る前提

単発スコアに意味はほぼない。比較対象とセットで初めて判断材料になる。 これがコンセプトテストの鉄則です。

6. 刺激（コンセプト文）の設計 — 測る前の勝負

見落とされがちですが、コンセプトの「見せ方（刺激）」そのものが結果を左右します。同じアイデアでも、刺激の作り込みで評価が変わる。

コンセプト文の標準構成

良いコンセプト文は、おおむね次の要素を持ちます。

インサイト / 課題: 「こんな不満、ありませんか」（共感の入口）
ベネフィット: その課題をどう解決するか（提供価値）
Reason to Believe（RTB）: なぜそれが可能なのか（信じる根拠・技術・実績）
製品形態・使用シーン: 具体的に何を、いつ、どう使うか

刺激設計の注意点

案ごとに情報量・作り込みを揃える: A案だけ作り込んでB案が雑だと、コンセプトではなく「コピーの巧拙」を測ってしまう。比較の公平性 が命
広告にしない: 誇張表現や煽りを入れると、コンセプトの素の力ではなく広告の力を測ることになる。淡々と価値を伝える
専門用語・社内用語を排除: ターゲットが一読で理解できる言葉に。理解できない刺激への低評価は、コンセプトの否定ではなく伝達の失敗

提示する文章の作り込みは、設問の文言設計と地続きです。アンケート設問の書き方完全ガイドの誘導・誇張回避の原則がそのまま効きます。

7. 編集部の視点 — コンセプトテストでやってはいけない5つ

業界事例と実務担当者の声を継続的に追っている立場から、コンセプトテストで繰り返し起きる事故を5つ。

1. 比較提示の高評価を絶対水準と誤読する

最頻出です。全案を並べて「勝った案は T2B 75%」を「市場で75%が買う」と読む。並べると差は誇張され、絶対水準は出ません。Go / No-Go はモナディックで、絶対水準を測ってから判断する。比較提示は一次スクリーニング限定。

2. ノルムなしで絶対値を判断する

「購入意向65%は高い」と、比較対象なしで断言する。カテゴリ・価格帯で水準は激変します。過去案・競合・カテゴリ平均と同じ設計で並べて初めて高低が言える。単発スコアは判断材料になりません。最低でも同一調査内にアンカー（既存品）を仕込む。

3. 購入意向を額面どおり信じる

「絶対買う40%」を事業計画にそのまま乗せる。購入意向は必ず上振れします。「絶対買う」を重く、「たぶん買う」を大きく割り引く。換算係数は自社実績から作る——他社・他カテゴリの係数は当たりません。

4. 刺激の作り込みを案ごとに変える

本命案だけ綺麗な刺激、対抗案は手抜き。これでは コンセプトの力ではなくコピーの巧拙 を測っている。情報量・トーン・作り込みを全案で揃える。比較の公平性が崩れた調査は、どれだけサンプルを集めても無意味です。

5. ターゲット外に聞いて満足する

集めやすいからと、ターゲットでない層（既存ヘビーユーザーや社員の知人）に聞く。新商品の評価は 本当に買ってほしいターゲット に聞かないと意味がない。スクリーニングで対象者を絞り込むのは必須です。対象者設計はスクリーニング設問の設計と運用ガイドを参照。

8. アンケートツール Kicue でのコンセプトテスト運用

コンセプトテストは「刺激を提示して標準指標を測る」設計フェーズと、「ノルム比較・統計検定で解釈する」分析フェーズに分かれます。Kicue が担うのは主に前者です。

コンセプト刺激の提示: コンセプト文（テキスト）の提示と、購入意向・新規性・好意度などのリッカート設問をセットで設計可能（設問タイプ）
モナディック設計のための分岐 / ランダム化: 回答者を案ごとに振り分けるモナディック、提示順をランダム化する順次モナディックの設計に、表示条件・分岐ロジックで対応（分岐ロジック完全ガイド）
アンカー（既存品）の同梱: 同一フォーム内に既存ヒット品・競合品の評価設問を入れ、ノルム比較の土台を作れる
対象者スクリーニング: 冒頭のスクリーニング設問でターゲット外を除外
回答者 ID 付き CSV エクスポート: トップボックス集計・案間比較を外部で行うための構造化データを出力

⚠️ Kicue で対応できない範囲

動画・リッチ画像の刺激提示には制約: 凝った動画コンセプトや精緻なパッケージ画像の提示は、外部ホスティングのリンク併用など運用上の工夫が必要なケースがある（提示形態は事前に要確認）
ノルムDB・業界基準値は持たない: BASES 等の商用ノルムとの比較は外部サービス。Kicue が提供するのは自社調査データのみ
統計的有意差検定・換算係数の計算はなし: 案間の購入意向差の検定や T2B→実購買の換算は Excel / R / Python / SPSS で実施（集計と有意差判定ガイド参照）
割り当ての厳密なセル管理（クォータ）には制約: モナディックのセル別サンプル数を厳密に揃える割付管理は、外部パネル会社との連携が必要なケースがある

関連記事として Van Westendorp PSM 設計ガイド・コンジョイント分析の実務・MaxDiff の設計ガイド・スクリーニング設問の設計と運用ガイド・アンケート設問の書き方完全ガイドを併読すると、「コンセプトを評価 → 価格・機能を詰める → 訴求の優先順位を測る」の発売前調査パイプライン全体が見えてきます。

まとめ — コンセプトテストを信頼できる調査にする6点

Go / No-Go はモナディックで — 絶対水準を測れるのはモナディックだけ。比較提示は一次スクリーニング限定
購入意向だけ見ない — 新規性 × 関連性に分解し、改善の方向を読む
トップボックスは割り引く — 購入意向は必ず上振れする。「絶対買う」を重く、「たぶん」を大きく割引
ノルムと比べて初めて高低が言える — 単発スコアに意味はない。過去案・競合・アンカーと同一設計で比較
刺激は案ごとに公平に作り込む — コピーの巧拙ではなくコンセプトの力を測る
ターゲットに聞く — スクリーニングで対象者を絞る。集めやすい層に聞いても判断材料にならない

コンセプトテストは「アンケートを取ること」が目的ではありません。提示方式・ノルム比較・刺激の公平性の3点を外さないこと で、会議室の声の大きさではなく市場の声で Go / No-Go を決められる、最も投資対効果の高い発売前の保険になります。

発売前のコンセプト評価調査を設計したい方は、無料のアンケートツール Kicue を試してみませんか。コンセプト文の提示と購入意向・新規性・好意度のリッカート設問設計、モナディック振り分けのための分岐ロジック、対象者スクリーニング、回答者 ID 付き CSV エクスポートまで、コンセプトテストの調査部分を 1 アカウントで開始できます（ノルムDB比較・統計的有意差検定・T2B から実購買への換算は外部のノルムサービスや R / Python / SPSS との組み合わせ運用となります）。

参考文献 (4件)

Page, A. L., & Rosenbaum, H. F. (1992). Developing an Effective Concept Testing Program for Consumer Durables. Journal of Product Innovation Management, 9(4), 267-277.
Moore, W. L. (1982). Concept Testing. Journal of Business Research, 10(3), 279-294.
Dahan, E., & Hauser, J. R. (2002). The Virtual Customer. Journal of Product Innovation Management, 19(5), 332-353.
Morwitz, V. G., Steckel, J. H., & Gupta, A. (2007). When do purchase intentions predict sales?. International Journal of Forecasting, 23(3), 347-364.