Guide du test de concept — Mesurer l'acceptation avant le lancement

Le projet de nouveau produit s'est resserré à trois pistes. Dans la salle de réunion, il reste le coup de cœur de celui qui parle le plus fort et le favori d'un dirigeant. Mais ce ne sont pas les gens de la salle de réunion qui vont l'acheter. S'en apercevoir une fois le produit lancé, avec un « ça ne s'est pas vendu », c'est l'échec le plus coûteux qui soit.

Le test de concept est l'étude qui consiste à demander à la cible « alors, qu'en pensez-vous ? » avant de mettre l'idée sur le marché. La tâche paraît simple, mais une seule erreur de conception et les chiffres se mettent à mentir. « Tous les concepts dépassent 70 % d'intention d'achat » — scène courante, et échec typique d'un mode de présentation mal choisi. Cet article met de l'ordre, avec le toucher de la pratique, depuis l'usage respectif des modes de présentation jusqu'aux indicateurs standard à mesurer, à la lecture des Top Box, et à la comparaison aux normes qui permet de trancher « nos chiffres sont-ils élevés ou faibles ? ».

1. Qu'est-ce qu'un test de concept — l'investissement qui évite l'échec le plus cher

Le test de concept est l'étude qui consiste à présenter à la cible un concept (une idée encore au stade où le produit n'existe pas) — produit, service, fonctionnalité, publicité — pour en évaluer l'acceptation. Il poursuit deux buts.

La décision Go / No-Go : ce concept mérite-t-il d'exister ? Parmi plusieurs pistes, laquelle pousser ?
L'identification des points d'amélioration : qu'est-ce qui accroche dans le concept, et qu'est-ce qui ne résonne pas ?

Sa plus grande valeur, c'est de « savoir avant de fabriquer ». Valider la direction avant le développement d'un prototype, avant les stocks, avant l'achat d'espace publicitaire, c'est diviser par dix le coût de l'échec. À l'inverse, bâcler l'étude ici et conclure à tort « c'est jouable », c'est s'exposer à l'échec le plus cher de tous — le retrait du marché après lancement.

À noter : le test de concept se situe en amont du « à quel prix vendre ». Une fois l'acceptation confirmée, on affine la combinaison optimale prix/fonctionnalités avec le Van Westendorp price sensitivity meter (PSM) ou l'analyse conjointe, et l'on mesure la priorité des éléments d'accroche avec le MaxDiff. Le test de concept est la porte d'entrée de cette grappe d'études pré-lancement.

2. L'usage respectif des modes de présentation — monadique / monadique séquentiel / comparatif

La plus grande décision de conception d'un test de concept, c'est « comment montrer ». Le mode de présentation change radicalement les résultats. Une erreur ici, et l'on obtient le « tous au-dessus de 70 % » de l'introduction — ou, à l'inverse, « tous très bas ».

Les 3 modes de présentation d'un concept

Monadique (Monadic) — une seule piste par personne

On répartit les répondants par piste : chacun n'évalue en profondeur qu'un seul concept. Le plus pur (peu de biais), et le plus proche de la situation d'achat réelle. Faiblesse : il faut autant d'échantillon que de pistes (trois pistes, trois fois plus). C'est lui, pour la vraie décision.

Monadique séquentiel (Sequential Monadic) — plusieurs pistes à la suite, pour une même personne

Une même personne évalue plusieurs pistes une à une, dans l'ordre. Bon rendement d'échantillon. Faiblesse : les pistes ultérieures se font comparer aux précédentes (effets d'ordre). On l'atténue en randomisant l'ordre de présentation. Le compromis le plus répandu en pratique.

Présentation comparative (Comparative / Competitive) — plusieurs pistes côte à côte

On présente plusieurs pistes en même temps, côte à côte, et l'on fait choisir « laquelle est la meilleure ». La hiérarchie relative entre pistes ressort nettement. Faiblesse : tout aligner exagère les écarts et l'on ne sait rien de l'acceptation absolue (se vendra-t-il vraiment sur le marché ?). Bon pour le filtrage.

Le principe d'usage respectif

Décision finale Go / No-Go → monadique : il dévore de l'échantillon, mais c'est le plus proche de l'achat réel (en rayon, on rencontre les pistes une à une) et il permet de lire le niveau absolu
Échantillon limité → monadique séquentiel + ordre de présentation randomisé : le compromis réaliste. Pour les effets d'ordre, la randomisation est impérative, comme l'établit effets d'ordre et conception de l'ordre des questions
Premier filtrage pour resserrer de nombreuses pistes à quelques-unes → présentation comparative : quand on ne veut voir que le rang relatif

Ne jamais lire comme un niveau absolu un « toutes les pistes bien notées en présentation comparative ». Aligner exagère les écarts, et l'on s'éloigne du marché réel (où l'on rencontre les pistes une à une).

3. Que mesurer — les indicateurs standard du test de concept

Les indicateurs à mesurer sont à peu près stabilisés dans la profession. Les cinq à retenir au minimum sont les suivants.

Intention d'achat (Purchase Intent) : « Si c'était lancé, auriez-vous envie de l'acheter ? ». Une échelle à 5 points (de « j'achète à coup sûr » à « je n'achète à aucun prix ») est le standard. L'indicateur le plus important
Nouveauté / singularité (Uniqueness / Newness) : « Y ressentez-vous une nouveauté inédite ? ». Si la nouveauté est faible, il n'y a aucune raison de quitter le produit existant
Attrait (Appeal / Liking) : « Dans l'ensemble, quel attrait y ressentez-vous ? ». L'évaluation globale de première impression
Pertinence / degré de « ça me concerne » (Relevance) : « Cela correspond-il à vos besoins ? ». Même très nouveau, si cela ne vous concerne pas, vous n'achetez pas
Singularité / différenciation (Differentiation) : « Le trouvez-vous différent des autres produits ? »

L'équilibre nouveauté × pertinence

Particulièrement crucial : l'arbitrage entre nouveauté et pertinence.

Nouveauté élevée mais pertinence faible → « intéressant, mais ça ne me concerne pas ». On en parle, mais ça ne se vend pas
Pertinence élevée mais nouveauté faible → « pratique, mais ce que j'ai déjà me suffit ». Pas de bascule
Les deux élevées → l'idéal. Nouveau, et nécessaire pour moi

Plutôt que de se réjouir ou de s'inquiéter sur la seule intention d'achat, décomposer « pourquoi cette intention d'achat ? » par la nouveauté et la pertinence fait apparaître la direction d'amélioration (ajouter de la nouveauté, ou rendre la chose plus « personnelle »).

4. La lecture des Top Box — l'art d'escompter les chiffres

Pour agréger l'intention d'achat, on utilise le Top Box / le Top 2 Box (T2B). Sur une échelle à 5 points, « j'achète à coup sûr » = Top Box, et « j'achète à coup sûr + j'achète probablement » = T2B.

L'intention d'achat est toujours surestimée

C'est ici le plus grand piège. L'intention d'achat mesurée en enquête sort toujours plus haut que le comportement d'achat réel. Parce que répondre « j'ai envie d'acheter » ne coûte rien. Il est très rare que le taux d'achat réel des répondants ayant dit « j'achète à coup sûr » soit fidèle à ce chiffre.

En pratique, la règle de l'art consiste à pondérer fortement le « j'achète à coup sûr » et à escompter largement le « j'achète probablement ». Certains secteurs disposent d'un coefficient de conversion « quelle part du T2B se traduit en achat réel » (un coefficient maison construit à partir des résultats passés), mais comme il varie énormément selon le produit et la gamme de prix, emprunter le coefficient d'un autre ne marche pas.

D'où la nécessité de la « comparaison aux normes » (chapitre suivant)

Même après escompte, il faut un référentiel pour trancher « le chiffre escompté est-il élevé ou faible ? ». Ce référentiel, ce sont les normes.

5. La comparaison aux normes — seul, « 70 % » ne dit pas s'il est élevé ou faible

L'erreur la plus fréquente dans un test de concept, c'est de juger sur la seule valeur absolue d'un score. « L'intention d'achat T2B est à 65 %, c'est élevé » — vraiment ?

Le niveau de l'intention d'achat varie énormément selon la catégorie, la gamme de prix et la méthode d'étude. Pour un nouveau parfum de produit du quotidien, un T2B de 70 % peut être banal, tandis que pour un bien durable haut de gamme, 40 % peut être excellent. Ce n'est qu'en comparant aux pistes passées, aux concurrents ou à la moyenne de catégorie (= normes / base de données normative) mesurés avec la même conception d'étude que l'on peut dire « élevé / faible ».

Comment construire et utiliser les normes

Accumuler ses propres pistes passées avec la même conception : la norme la plus fiable. Faire des scores de produits passés réussis et ratés une ligne de référence
Glisser un « ancrage » dans la même étude : faire évaluer, avec les mêmes questions et aux côtés des pistes testées, un produit phare maison existant ou un produit concurrent. On sait ainsi, à conditions identiques, « comment la nouvelle piste se situe face à un succès existant »
Recourir à la base de données normative d'un institut d'études : les bases normatives commerciales comme BASES (NielsenIQ) disposent de valeurs de référence par catégorie. Mais elles dépendent de la méthode : il faut donc mesurer avec la méthode de l'institut

Un score isolé n'a quasiment aucun sens. Ce n'est qu'avec un point de comparaison qu'il devient un élément de décision. C'est la règle d'or du test de concept.

6. La conception du stimulus (le texte du concept) — la partie se joue avant de mesurer

On l'oublie souvent : la « manière de montrer le concept » (le stimulus) influence elle-même les résultats. À idée égale, l'évaluation change selon le soin apporté au stimulus.

La structure standard d'un texte de concept

Un bon texte de concept comporte, en gros, les éléments suivants.

Insight / problème : « Vous n'auriez pas, vous aussi, cette frustration ? » (la porte de l'adhésion)
Bénéfice : comment ce problème est résolu (la valeur apportée)
Reason to Believe (RTB / raison de croire) : pourquoi c'est possible (fondement, technologie, antécédents qui font croire)
Forme du produit et scène d'usage : concrètement quoi, quand et comment l'utiliser

Les points de vigilance dans la conception du stimulus

Égaliser la quantité d'information et le soin de réalisation d'une piste à l'autre : si seule la piste A est soignée et la B bâclée, on ne mesure pas le concept mais « le talent de copywriting ». L'équité de la comparaison est vitale
Ne pas en faire une publicité : glisser des formulations exagérées ou racoleuses, c'est mesurer la force de la publicité et non la force brute du concept. Transmettre la valeur sobrement
Bannir le jargon et le langage interne : des mots que la cible comprend à la première lecture. Une mauvaise note infligée à un stimulus incompréhensible n'est pas un rejet du concept, mais un échec de transmission

Le soin apporté au texte présenté est dans la continuité directe de la rédaction des questions. Les principes d'évitement de l'induction et de l'exagération du guide complet de la rédaction des questions d'enquête s'appliquent tels quels.

7. Le point de vue de la rédaction — les 5 choses à ne pas faire en test de concept

Du point de vue de quelqu'un qui suit en continu les cas du secteur et la parole des praticiens, voici cinq accidents qui se répètent en test de concept.

1. Lire la bonne note en comparatif comme un niveau absolu

Le plus fréquent. Aligner toutes les pistes et lire « la piste gagnante est à T2B 75 % » comme « 75 % achètent sur le marché ». Aligner exagère les écarts ; le niveau absolu ne ressort pas. Le Go / No-Go se décide après avoir mesuré le niveau absolu en monadique. La présentation comparative est réservée au premier filtrage.

2. Juger une valeur absolue sans normes

Affirmer « 65 % d'intention d'achat, c'est élevé » sans point de comparaison. Le niveau varie radicalement selon la catégorie et la gamme de prix. Ce n'est qu'en alignant pistes passées, concurrents et moyenne de catégorie avec la même conception que l'on peut dire haut ou bas. Un score isolé n'est pas un élément de décision. Au minimum, glisser un ancrage (produit existant) dans la même étude.

3. Croire l'intention d'achat au pied de la lettre

Reporter tel quel un « 40 % j'achète à coup sûr » dans le plan d'affaires. L'intention d'achat est toujours surestimée. Pondérer fortement le « j'achète à coup sûr » et escompter largement le « j'achète probablement ». Le coefficient de conversion se construit à partir de ses propres résultats — celui d'un autre acteur, d'une autre catégorie, ne marche pas.

4. Faire varier le soin du stimulus d'une piste à l'autre

Un stimulus soigné pour la seule piste favorite, bâclé pour les concurrentes. Là, on mesure non la force du concept, mais le talent de copywriting. Égaliser la quantité d'information, le ton, le soin de réalisation sur toutes les pistes. Une étude dont l'équité de comparaison s'est effondrée n'a aucun sens, quel que soit l'échantillon réuni.

5. Se contenter d'interroger hors cible

Par facilité de recrutement, interroger une population qui n'est pas la cible (gros utilisateurs existants, ou connaissances du personnel). L'évaluation d'un nouveau produit n'a de sens que si l'on interroge la cible que l'on veut vraiment voir acheter. Resserrer la population par filtrage est impératif. Pour la conception de la population, voir le guide de conception et d'exploitation des questions de filtrage.

8. Mener un test de concept avec l'outil de sondage Kicue

Le test de concept se scinde en une phase de conception, « présenter le stimulus et mesurer les indicateurs standard », et une phase d'analyse, « interpréter par comparaison aux normes et tests statistiques ». Kicue prend en charge principalement la première.

Présentation du stimulus de concept : on peut concevoir d'un seul tenant la présentation du texte de concept (texte) et les questions de Likert telles que l'intention d'achat, la nouveauté, l'attrait (types de questions)
Branchement / randomisation pour la conception monadique : la conception monadique, qui répartit les répondants par piste, et le monadique séquentiel, qui randomise l'ordre de présentation, sont pris en charge par les conditions d'affichage et la logique de branchement (guide complet de la logique de branchement)
Inclusion d'un ancrage (produit existant) : on peut insérer dans un même formulaire des questions d'évaluation d'un produit phare existant ou concurrent, et poser ainsi le socle de la comparaison aux normes
Filtrage de la population : exclure le hors-cible par une question de filtrage en tête de formulaire
Export CSV avec identifiant de répondant : sortie de données structurées pour mener à l'extérieur l'agrégation des Top Box et la comparaison entre pistes

⚠️ Ce que Kicue ne peut pas faire

Contraintes sur la présentation de stimuli vidéo / images riches : la présentation de concepts vidéo élaborés ou d'images de packaging soignées peut, dans certains cas, exiger des aménagements d'exploitation comme le recours à un hébergement externe et à des liens (vérifier la forme de présentation au préalable)
Pas de base de données normative ni de valeurs de référence sectorielles : la comparaison aux normes commerciales comme BASES relève d'un service externe. Kicue ne fournit que ses propres données d'étude
Pas de test statistique de significativité ni de calcul de coefficient de conversion : le test des écarts d'intention d'achat entre pistes et la conversion T2B → achat réel se mènent sous Excel / R / Python / SPSS (voir le guide de l'agrégation et des tests de significativité)
Contraintes sur la gestion stricte des cellules d'affectation (quotas) : la gestion des quotas qui aligne strictement le nombre d'échantillons par cellule en monadique peut, dans certains cas, exiger une coordination avec un institut de panel externe

Comme articles connexes, lire en parallèle le guide de conception du PSM de Van Westendorp, l'analyse conjointe en pratique, le guide de conception du MaxDiff, le guide de conception et d'exploitation des questions de filtrage et le guide complet de la rédaction des questions d'enquête : on voit alors se dessiner tout le pipeline des études pré-lancement, « évaluer le concept → affiner prix et fonctionnalités → mesurer la priorité des accroches ».

En résumé — six points pour faire du test de concept une étude fiable

Le Go / No-Go en monadique — seul le monadique permet de mesurer le niveau absolu. La présentation comparative est réservée au premier filtrage
Ne pas regarder que l'intention d'achat — la décomposer en nouveauté × pertinence et lire la direction d'amélioration
Escompter les Top Box — l'intention d'achat est toujours surestimée. Pondérer fortement le « j'achète à coup sûr », escompter largement le « probablement »
Ce n'est qu'en comparant aux normes que l'on peut dire haut ou bas — un score isolé n'a aucun sens. Comparer aux pistes passées, aux concurrents et à l'ancrage avec la même conception
Soigner le stimulus de façon équitable d'une piste à l'autre — mesurer la force du concept, pas le talent de copywriting
Interroger la cible — resserrer la population par filtrage. Interroger une population facile à recruter ne fournit pas d'élément de décision

Le test de concept n'a pas pour but « de réaliser une enquête ». En ne lâchant pas les trois points — mode de présentation, comparaison aux normes, équité du stimulus —, il devient l'assurance pré-lancement au meilleur rapport coût/efficacité : décider le Go / No-Go non sur le volume de la voix dans la salle de réunion, mais sur la voix du marché.

Vous souhaitez concevoir une étude d'évaluation de concept avant lancement ? Essayez l'outil de sondage gratuit Kicue. Présentation du texte de concept et conception de questions de Likert pour l'intention d'achat, la nouveauté et l'attrait, logique de branchement pour la répartition monadique, filtrage de la population, export CSV avec identifiant de répondant : la partie « étude » du test de concept démarre depuis un seul compte (la comparaison à une base normative, les tests statistiques de significativité et la conversion du T2B en achat réel s'exploitent en combinaison avec un service de normes externe ou avec R / Python / SPSS).

Références

Page, A. L., & Rosenbaum, H. F. (1992). Developing an Effective Concept Testing Program for Consumer Durables. Journal of Product Innovation Management, 9(4), 267-277.
Moore, W. L. (1982). Concept Testing. Journal of Business Research, 10(3), 279-294.
Dahan, E., & Hauser, J. R. (2002). The Virtual Customer. Journal of Product Innovation Management, 19(5), 332-353.
Morwitz, V. G., Steckel, J. H., & Gupta, A. (2007). When do purchase intentions predict sales?. International Journal of Forecasting, 23(3), 347-364.