ノウハウ

コンセプトテスト調査ガイド — 発売前に受容性を測る設計

新商品・新機能・広告コピーを発売前にアンケートで評価するコンセプトテストの設計を解説。モナディック・順次モナディック・比較提示の使い分け、購入意向・新規性・好意度・独自性という標準指標、トップボックスの読み方、ノルム(基準値)比較の重要性、刺激(コンセプト文)の作り込みまで、実務の勘所で整理する。PSM・コンジョイント・MaxDiff の前段に位置づく発売前調査の入口。

新商品の企画が3つに絞られた。会議室では声の大きい人の推しと、役員のお気に入りが残っている。でも、それを買うのは会議室の人たちではありません。発売してから「売れませんでした」と気づくのは、いちばん高くつく失敗です。

コンセプトテストは、アイデアを世に出す前に、ターゲット顧客に「これ、どう?」と聞く調査 です。やることは単純に見えて、設計を一つ間違えると数字が嘘をつきます。「全部のコンセプトが購入意向70%超え」——よくある光景ですが、これは提示方式を間違えた典型的な失敗です。本稿では、提示方式の使い分けから、測るべき標準指標、トップボックスの読み方、そして「自社の数字は高いのか低いのか」を判断するためのノルム比較までを、実務の手触りで整理します。

1. コンセプトテストとは — 一番高い失敗を避ける投資

コンセプトテストは、製品・サービス・機能・広告などの コンセプト(まだ実物がない段階のアイデア) を、ターゲット顧客に提示して受容性を評価する調査です。目的は2つあります。

  • Go / No-Go の判断: そもそも世に出す価値があるか。複数案のどれを進めるか
  • 改善点の発見: コンセプトのどこが刺さり、どこが響かないか

最大の価値は 「作る前に分かる」 こと。プロトタイプ開発・在庫・広告出稿の前に方向性を検証できれば、失敗のコストが桁違いに小さくなります。逆に言えば、ここで雑な調査をして「行ける」と誤判断すると、最も高い失敗——市場に出してからの撤退——を招きます。

なお、コンセプトテストは 「いくらで売るか」の前段 です。受容性を確認した後に、Van Westendorp 価格感度メーター(PSM)コンジョイント分析 で価格・機能の最適な組み合わせを詰め、MaxDiff で訴求要素の優先順位を測る。コンセプトテストは、この発売前調査クラスタの入口にあたります。

2. 提示方式の使い分け — モナディック / 順次モナディック / 比較

コンセプトテスト最大の設計判断が 「どう見せるか」 です。提示方式で結果が大きく変わります。ここを間違えると、冒頭の「全部70%超え」や逆に「全部低い」が起きます。

コンセプト提示の3方式

モナディック(Monadic)— 1人1案だけ
回答者を案ごとに分け、各人は1つのコンセプトだけを深く評価する。最も純粋(バイアスが少ない)で、現実の購買状況に近い。弱点: 案の数だけサンプルが要る(3案なら3倍)。本命の意思決定はこれ。
順次モナディック(Sequential Monadic)— 1人が複数案を順に
1人が複数案を1つずつ順番に評価する。サンプル効率が良い。弱点: 後の案が前の案と比較されてしまう(順序効果)。提示順をランダム化して緩和する。実務で最も多い折衷案。
比較提示(Comparative / Competitive)— 複数案を並べて
複数案を同時に並べて「どれが一番良いか」を選ばせる。案間の相対的な優劣は鮮明に出る。弱点: 全部並べると差が誇張され、絶対的な受容度(市場で本当に売れるか)は分からない。スクリーニング向き。

使い分けの原則

  • 最終的な Go / No-Go の判断 → モナディック: サンプルは食うが、現実の購買(人は店頭で1案ずつ出会う)に最も近く、絶対水準を読める
  • サンプルが限られる → 順次モナディック + 提示順ランダム化: 現実的な折衷。順序効果は 順序効果と設問順設計 の知見でランダム化必須
  • 多数の案から数案に絞る一次スクリーニング → 比較提示: 相対順位だけ見たいとき

「比較提示で全案を見せて高評価が出た」を絶対水準だと誤読しない。 並べると差が誇張され、実際の市場(1案ずつ出会う)とはかけ離れます。

3. 何を測るか — コンセプトテストの標準指標

測る指標は、業界で概ね固まっています。最低限おさえるべきは次の5つです。

  • 購入意向(Purchase Intent): 「発売されたら買いたいと思いますか」。5段階(「絶対買う」〜「絶対買わない」)が標準。最重要指標
  • 新規性 / 目新しさ(Uniqueness / Newness): 「今までにない新しさを感じますか」。新規性が低いと、既存品から乗り換える理由がない
  • 好意度(Appeal / Liking): 「全体としてどのくらい魅力を感じますか」。第一印象の総合評価
  • 関連性 / 自分ごと度(Relevance): 「あなたのニーズに合っていますか」。新規性が高くても自分に関係なければ買わない
  • 独自性 / 差別化(Differentiation): 「他の商品と違うと思いますか」

新規性 × 関連性のバランス

特に重要なのが 新規性と関連性のトレードオフ です。

  • 新規性は高いが関連性が低い → 「面白いけど、自分には関係ない」。話題にはなるが売れない
  • 関連性は高いが新規性が低い → 「便利そうだけど、今あるもので足りる」。乗り換えが起きない
  • 両方高い → 理想。新しくて、かつ自分に必要

購入意向だけ見て一喜一憂せず、「なぜその購入意向なのか」を新規性・関連性で分解 すると、改善の方向(新しさを足すのか、自分ごと化を足すのか)が見えます。

4. トップボックスの読み方 — 数字を割り引く作法

購入意向の集計では トップボックス(Top Box)/ トップ2ボックス(Top 2 Box, T2B) を使います。5段階なら「絶対買う」=トップボックス、「絶対買う + たぶん買う」=T2B です。

購入意向は必ず上振れする

ここが最大の落とし穴です。アンケートの購入意向は、実際の購買行動より必ず高く出ます。 「買いたい」と答えるのはタダだからです。「絶対買う」と答えた人の実購買率が、その数字どおりになることはまずありません。

実務では 「絶対買う」を重く、「たぶん買う」を大きく割り引く のが定石です。業界によっては「T2B の何割が実購買」という換算係数(過去の実績から作る自社係数)を持っていますが、これは商材・価格帯で大きく変わるため、他社の係数を借用しても当たりません

だから「ノルム比較」が必要(次章)

割り引くにしても、「割引後の数字が高いのか低いのか」を判断する基準 が要ります。それがノルムです。

5. ノルム比較 — 「70%」が高いか低いかは単体では分からない

コンセプトテストで最もよくある誤りが、スコアの絶対値だけを見て判断する ことです。「購入意向 T2B が 65%、これは高い」——本当でしょうか。

購入意向の水準は、カテゴリ・価格帯・調査手法で大きく変わります。日用品の新フレーバーなら T2B 70% は平凡でも、高額耐久財なら 40% で優秀かもしれない。同じ調査設計で測った過去案・競合・カテゴリ平均(=ノルム / 基準値)と比べて初めて、「高い / 低い」が言えます。

ノルムの作り方・使い方

  • 自社の過去案を同じ設計で蓄積する: 最も信頼できるノルム。成功した過去商品・失敗した過去商品のスコアを基準線にする
  • 同一調査内に「アンカー」を仕込む: テスト案と一緒に、既存の自社ヒット商品や競合品も同じ設問で評価させる。これで「新案は既存ヒットと比べてどうか」が同一条件で分かる
  • 市場調査会社のノルムDBを使う: BASES(NielsenIQ)などの商用ノルムDBは、カテゴリ別の基準値を持つ。ただし手法依存なので、その会社の手法で測る前提

単発スコアに意味はほぼない。比較対象とセットで初めて判断材料になる。 これがコンセプトテストの鉄則です。

6. 刺激(コンセプト文)の設計 — 測る前の勝負

見落とされがちですが、コンセプトの「見せ方(刺激)」そのものが結果を左右します。同じアイデアでも、刺激の作り込みで評価が変わる。

コンセプト文の標準構成

良いコンセプト文は、おおむね次の要素を持ちます。

  • インサイト / 課題: 「こんな不満、ありませんか」(共感の入口)
  • ベネフィット: その課題をどう解決するか(提供価値)
  • Reason to Believe(RTB): なぜそれが可能なのか(信じる根拠・技術・実績)
  • 製品形態・使用シーン: 具体的に何を、いつ、どう使うか

刺激設計の注意点

  • 案ごとに情報量・作り込みを揃える: A案だけ作り込んでB案が雑だと、コンセプトではなく「コピーの巧拙」を測ってしまう。比較の公平性 が命
  • 広告にしない: 誇張表現や煽りを入れると、コンセプトの素の力ではなく広告の力を測ることになる。淡々と価値を伝える
  • 専門用語・社内用語を排除: ターゲットが一読で理解できる言葉に。理解できない刺激への低評価は、コンセプトの否定ではなく伝達の失敗

提示する文章の作り込みは、設問の文言設計と地続きです。アンケート設問の書き方完全ガイド の誘導・誇張回避の原則がそのまま効きます。

7. 編集部の視点 — コンセプトテストでやってはいけない5つ

業界事例と実務担当者の声を継続的に追っている立場から、コンセプトテストで繰り返し起きる事故を5つ。

1. 比較提示の高評価を絶対水準と誤読する

最頻出です。全案を並べて「勝った案は T2B 75%」を「市場で75%が買う」と読む。並べると差は誇張され、絶対水準は出ません。Go / No-Go はモナディックで、絶対水準を測ってから判断する。比較提示は一次スクリーニング限定。

2. ノルムなしで絶対値を判断する

「購入意向65%は高い」と、比較対象なしで断言する。カテゴリ・価格帯で水準は激変します。過去案・競合・カテゴリ平均と同じ設計で並べて初めて高低が言える。単発スコアは判断材料になりません。最低でも同一調査内にアンカー(既存品)を仕込む。

3. 購入意向を額面どおり信じる

「絶対買う40%」を事業計画にそのまま乗せる。購入意向は必ず上振れします。「絶対買う」を重く、「たぶん買う」を大きく割り引く。換算係数は自社実績から作る——他社・他カテゴリの係数は当たりません。

4. 刺激の作り込みを案ごとに変える

本命案だけ綺麗な刺激、対抗案は手抜き。これでは コンセプトの力ではなくコピーの巧拙 を測っている。情報量・トーン・作り込みを全案で揃える。比較の公平性が崩れた調査は、どれだけサンプルを集めても無意味です。

5. ターゲット外に聞いて満足する

集めやすいからと、ターゲットでない層(既存ヘビーユーザーや社員の知人)に聞く。新商品の評価は 本当に買ってほしいターゲット に聞かないと意味がない。スクリーニングで対象者を絞り込むのは必須です。対象者設計は スクリーニング設問の設計と運用ガイド を参照。

8. アンケートツール Kicue でのコンセプトテスト運用

コンセプトテストは「刺激を提示して標準指標を測る」設計フェーズと、「ノルム比較・統計検定で解釈する」分析フェーズに分かれます。Kicue が担うのは主に前者です。

  • コンセプト刺激の提示: コンセプト文(テキスト)の提示と、購入意向・新規性・好意度などのリッカート設問をセットで設計可能(設問タイプ
  • モナディック設計のための分岐 / ランダム化: 回答者を案ごとに振り分けるモナディック、提示順をランダム化する順次モナディックの設計に、表示条件・分岐ロジックで対応(分岐ロジック完全ガイド
  • アンカー(既存品)の同梱: 同一フォーム内に既存ヒット品・競合品の評価設問を入れ、ノルム比較の土台を作れる
  • 対象者スクリーニング: 冒頭のスクリーニング設問でターゲット外を除外
  • 回答者 ID 付き CSV エクスポート: トップボックス集計・案間比較を外部で行うための構造化データを出力

⚠️ Kicue で対応できない範囲

  • 動画・リッチ画像の刺激提示には制約: 凝った動画コンセプトや精緻なパッケージ画像の提示は、外部ホスティングのリンク併用など運用上の工夫が必要なケースがある(提示形態は事前に要確認)
  • ノルムDB・業界基準値は持たない: BASES 等の商用ノルムとの比較は外部サービス。Kicue が提供するのは自社調査データのみ
  • 統計的有意差検定・換算係数の計算はなし: 案間の購入意向差の検定や T2B→実購買の換算は Excel / R / Python / SPSS で実施(集計と有意差判定ガイド 参照)
  • 割り当ての厳密なセル管理(クォータ)には制約: モナディックのセル別サンプル数を厳密に揃える割付管理は、外部パネル会社との連携が必要なケースがある

関連記事として Van Westendorp PSM 設計ガイドコンジョイント分析の実務MaxDiff の設計ガイドスクリーニング設問の設計と運用ガイドアンケート設問の書き方完全ガイド を併読すると、「コンセプトを評価 → 価格・機能を詰める → 訴求の優先順位を測る」の発売前調査パイプライン全体が見えてきます。

まとめ — コンセプトテストを信頼できる調査にする6点

  1. Go / No-Go はモナディックで — 絶対水準を測れるのはモナディックだけ。比較提示は一次スクリーニング限定
  2. 購入意向だけ見ない — 新規性 × 関連性に分解し、改善の方向を読む
  3. トップボックスは割り引く — 購入意向は必ず上振れする。「絶対買う」を重く、「たぶん」を大きく割引
  4. ノルムと比べて初めて高低が言える — 単発スコアに意味はない。過去案・競合・アンカーと同一設計で比較
  5. 刺激は案ごとに公平に作り込む — コピーの巧拙ではなくコンセプトの力を測る
  6. ターゲットに聞く — スクリーニングで対象者を絞る。集めやすい層に聞いても判断材料にならない

コンセプトテストは「アンケートを取ること」が目的ではありません。提示方式・ノルム比較・刺激の公平性の3点を外さないこと で、会議室の声の大きさではなく市場の声で Go / No-Go を決められる、最も投資対効果の高い発売前の保険になります。


発売前のコンセプト評価調査を設計したい方は、無料のアンケートツール Kicue を試してみませんか。コンセプト文の提示と購入意向・新規性・好意度のリッカート設問設計、モナディック振り分けのための分岐ロジック、対象者スクリーニング、回答者 ID 付き CSV エクスポートまで、コンセプトテストの調査部分を 1 アカウントで開始できます(ノルムDB比較・統計的有意差検定・T2B から実購買への換算は外部のノルムサービスや R / Python / SPSS との組み合わせ運用となります)。

参考文献 (4件)

関連記事

ノウハウ

アンケートの設問数は何問が適切か — 離脱を防ぐ長さの決め方

アンケートの設問数は何問が適切か。結論は「5分・15問前後」を目安に、目的から逆算して削ること。設問数が増えると回答率と回答品質が落ちる理由、適切な長さを決める5ステップ、離脱を防ぐ削り方を、Galesic & Bosnjak (2009) などの研究と実務の勘所で解説する。

ノウハウ

顧客セグメンテーション調査 — クラスター分析で顧客を分ける

アンケートデータから顧客を意味のあるセグメントに分類する顧客セグメンテーション調査の設計を解説。事前分類と事後分類(クラスター分析)の違い、デモグラ・行動・ニーズ・サイコグラフィックの4つの分類軸、階層クラスター・k-means・潜在クラス分析の使い分け、セグメント数の決め方、使えるセグメントの6条件まで、Smith (1956) 以来のセグメンテーション研究と実務の勘所で整理する。

ノウハウ

キードライバー分析ガイド — 満足度・NPSを動かす要因の特定

キードライバー分析(Key Driver Analysis)で総合満足度・NPSを動かしている要因を特定する手法を解説。相関係数だけで判断する落とし穴、重回帰分析の多重共線性という罠、それを解くShapley値・相対的重み付け(Johnson's Relative Weights)、相関と因果の混同という最大の誤読まで、Johnson (2000) 以来の相対重要度研究と実務の勘所で整理する。IPA(重要度-満足度分析)の導出重要度の出力元としての位置づけも示す。

Kicue でアンケートを作ってみませんか?

調査票をアップロードするだけで、AIが30秒でWebアンケートを自動生成します。

無料で始める