Guide des enquêtes de segmentation client — Diviser les clients par analyse typologique

L'analyse des facteurs clés a montré que « ce qui fait bouger la satisfaction globale, c'est le support ». L'analyse importance-performance a tranché : « les chantiers prioritaires, ce sont le support et le prix ». Mais ces conclusions reposent sur un présupposé caché : celui que « les clients forment un seul bloc ».

En réalité, un nouveau client sensible au prix et un utilisateur intensif en quête de profondeur fonctionnelle n'ont absolument pas les mêmes leviers de satisfaction. Quand la moyenne globale dit « le support pèse », c'est le résultat de deux populations différentes mélangées et nivelées, et ce n'est exact pour aucune des deux — c'est le problème, bien connu en statistique, du « client moyen qui n'existe pas ». Ce que résout l'enquête de segmentation client. On repère, dans les données d'enquête, des « blocs de clients qui se ressemblent », puis on change de stratégie bloc par bloc. Cet article met de l'ordre, avec le grain de la pratique, depuis les deux grandes approches de segmentation, en passant par le choix des axes, les techniques d'analyse typologique, le nombre de segments, jusqu'aux « conditions d'un segment exploitable ».

1. Pourquoi segmenter — le piège de la moyenne globale

L'analyse des facteurs clés comme l'analyse importance-performance (IPA) sont puissantes, mais partagent une même faiblesse : elles moyennent l'ensemble des répondants comme une seule population.

Quand on moyenne des clients hétérogènes, il se produit un phénomène proche du paradoxe de Simpson. « Globalement, le support est le premier levier de satisfaction » — mais que ce soit le prix pour le segment A et les fonctionnalités pour le segment B, c'est le pain quotidien. À décider sur la seule moyenne globale, on finit par investir dans des actions moyennes et insipides qui n'accrochent aucun segment.

L'objectif de la segmentation est simple : diviser en blocs de clients qui réagissent de façon semblable, puis adapter le meilleur levier à chaque bloc. Depuis que le classique du marketing Smith (1956) a opposé la « différenciation de produit » à la « segmentation de marché », la segmentation demeure le socle de la stratégie marketing.

Lorsqu'on rejoue la KDA / l'IPA segment par segment, on voit apparaître « des leviers différents selon le segment, invisibles à l'échelle globale ». La segmentation est la dernière pièce de la trilogie analytique (identification des facteurs → priorisation → classement des clients).

2. Segmentation a priori vs post-hoc — deux approches

Il existe deux approches fondamentalement différentes pour découper les clients. Les confondre, c'est se tromper dès la conception de l'analyse.

Segmentation a priori (descriptive, fondée sur des descripteurs)

L'analyste découpe mécaniquement selon des critères fixés à l'avance : par tranche d'âge, par formule d'abonnement, par fréquence d'usage, etc. Le critère est clair, l'exploitation simple, et n'importe qui peut le reproduire.

Son point faible : rien ne garantit que ce critère sépare réellement les comportements clients. « On a découpé entre les 20–30 ans et les 30–40 ans, mais en fait leurs comportements d'achat étaient quasi identiques » : ça arrive souvent. On a l'impression d'avoir segmenté, sans que les actions changent.

Segmentation post-hoc (fondée sur les clusters)

À partir des schémas de réponse à l'enquête (satisfaction, besoins, valeurs, etc.), on découvre par les données des « blocs naturels ». On recourt à l'analyse typologique ou à l'analyse en classes latentes. Approche « on laisse parler les données » : des segments émergent que les préjugés a priori n'auraient pas su repérer.

Son point faible : les résultats varient facilement d'une fois à l'autre, sont difficiles à interpréter et peu reproductibles en exploitation. Il faut une capacité à interpréter « qui est ce segment, au juste ».

Le principe d'usage respectif

D'abord, dégrossir avec la segmentation a priori : découper sur les données démographiques et comportementales, et voir si la KDA/IPA fait apparaître des écarts.
Si aucun écart n'apparaît, ou pour creuser, passer au post-hoc : chercher par analyse typologique des blocs fondés sur les besoins et les valeurs.
En pratique, on combine les deux : on « profile » les blocs trouvés en post-hoc à l'aide des variables a priori (âge, formule) pour en saisir l'identité (chapitre 6).

3. Choisir les axes de segmentation — quatre types de variables

Sur quelle base découper ? Les variables de segmentation se répartissent grossièrement en quatre types, et « la facilité à découper » et « la facilité à relier à une action » s'opposent en arbitrage.

Les quatre types de variables de segmentation

Démographiques

Âge, sexe, revenu, région, profession, etc. Faciles à obtenir et à décrire, mais peu explicatives du comportement. Les « femmes de 30 à 40 ans » n'achètent pas toutes de la même manière. Faibles seules, elles conviennent comme appoint aux autres axes.

Comportementales

Fréquence d'usage, montant d'achat, fonctionnalités utilisées, ancienneté, etc. Fondées sur le comportement réel, donc faciles à relier à une action. L'analyse RFM (récence, fréquence, montant) en est l'exemple type. Faciles à rapprocher des données CRM.

Besoins / bénéfices (la valeur recherchée)

« Sur quoi se fonde le choix ». Priorité au prix, à la qualité, au support, etc. L'axe le plus directement lié au développement produit et au discours d'accroche, mais il faut une conception d'enquête soignée pour le mesurer. La vedette de la segmentation post-hoc.

Psychographiques (valeurs, mode de vie)

Personnalité, valeurs, mode de vie, attitudes. Capte les motivations profondes, mais difficile à mesurer et sujet à une interprétation subjective. L'usage seul est réservé aux praticiens aguerris.

Les règles de l'art

La combinaison comportement + besoins est la plus susceptible de produire des segments réellement « exploitables ».
Utiliser les variables démographiques non comme axe de découpage, mais comme axe de profilage (on décrit après coup : « ce segment compte beaucoup de trentenaires »).
Pour mesurer besoins et bénéfices, la conception des questions à échelle de Likert est la clé. Voir le guide de conception des échelles de Likert.

4. Les techniques d'analyse typologique — hiérarchique, k-means, classes latentes

Le cœur de la segmentation post-hoc, c'est l'analyse typologique. Les trois techniques de référence ont chacune leur terrain de prédilection.

Classification ascendante hiérarchique

On fusionne les individus un à un, puis on lit la structure des blocs sur un dendrogramme. Avantages : inutile de fixer le nombre de segments à l'avance, et la structure se saisit visuellement. La méthode de Ward (Ward's method) est fréquemment employée. Point faible : le coût de calcul est élevé, et au-delà de quelques milliers d'individus, ça devient lourd. Convient aux échantillons petits à moyens et à la phase exploratoire.

Méthode des k-moyennes (k-means)

On fixe d'abord le nombre de segments k, puis on affecte chaque point au centroïde le plus proche et on met à jour les centroïdes, en boucle. Rapide même sur de gros volumes, c'est la méthode la plus répandue. Points faibles : (1) il faut décider k à l'avance ; (2) le résultat varie selon les valeurs initiales (exécuter plusieurs fois pour vérifier la stabilité) ; (3) elle est sensible à l'échelle des variables (toujours standardiser avant de les injecter).

Analyse en classes latentes (ACL — Latent Class Analysis, LCA)

Modèle statistique qui pose que « chaque répondant appartient, de façon probabiliste, à l'une des classes latentes ». Elle s'est développée en marketing depuis Kamakura & Russell (1989). Avantages : on peut choisir le nombre de segments sur un critère statistique (BIC, etc.) et traiter naturellement les variables catégorielles. Point faible : forte technicité et nécessité d'un logiciel dédié (Latent GOLD, le poLCA de R, etc.).

Prétraitement : réduire la dimension par analyse factorielle

Quand l'enquête compte 20 ou 30 questions, les injecter telles quelles dans l'analyse typologique fait que des questions corrélées pondèrent en double un même concept. La règle de l'art est de d'abord réduire, par analyse factorielle (factor analysis), vers des facteurs comme « orientation prix » ou « orientation qualité », puis de classifier sur les scores factoriels. Le guide de la fidélité et de la validité des enquêtes traite du lien entre analyse factorielle et construits.

5. Comment décider du nombre de segments — indices statistiques et interprétabilité

« En combien découper » est le plus grand casse-tête de la segmentation. On décide à la fois sur des indices statistiques et sur l'interprétabilité métier.

Les repères statistiques

La méthode du coude (Elbow Method) : on choisit le point du « coude » où la décroissance de la « somme des carrés intra-groupes » s'aplatit à mesure qu'augmente le nombre de clusters.
Le coefficient de silhouette (Silhouette) : il évalue, de -1 à 1, à quel point chaque point s'ajuste à son propre cluster et s'éloigne du cluster voisin. C'est l'indice de Rousseeuw (1987) ; plus on est proche de 1, mieux c'est.
En analyse en classes latentes, le BIC / l'AIC : on choisit le nombre de clusters qui minimise le critère d'information.

Mais la décision finale revient à « l'interprétabilité »

Même si l'indice statistique sort « 6 segments est l'optimum », si l'on ne sait pas décrire ces 6 segments en mots, ça n'a aucun sens. En pratique, on se stabilise souvent autour de 3 à 6 segments. La raison est simple : au-delà de 7, on ne peut plus différencier les actions (les ressources de l'organisation n'y suffisent pas).

« Même statistiquement optimal, on n'adopte pas un nombre de segments qu'on ne peut pas activer en entreprise. » C'est la règle d'or de la décision sur le nombre de segments. La statistique ne fait que proposer des candidats ; la décision finale tient à : « peut-on déployer une action distincte pour chacun de ces segments ? ».

6. Profilage et passage aux personas — les six conditions d'un segment exploitable

Une fois les clusters obtenus, on décrit (profile) qui est chacun. Pour chaque segment, on calcule les valeurs moyennes démographiques, comportementales et de besoins, puis on verbalise — par exemple « ce segment privilégie le prix, compte beaucoup de trentenaires et regroupe de nouveaux clients à faible fréquence d'usage » — et, si besoin, on en fait des personas.

Cela dit, tout bloc statistiquement distinct n'est pas nécessairement un « segment exploitable ». On vérifie qu'il satisfait aux conditions d'un segment utilisable en pratique, telles que Kotler les a synthétisées.

Mesurable (Measurable) : on peut mesurer la taille et les caractéristiques du segment.
Accessible (Accessible) : on peut atteindre ce segment par la publicité ou le commercial.
Substantielle (Substantial) : il a une taille à la hauteur de l'investissement (impossible de dédier une action à un segment de 1 %).
Différenciable (Differentiable) : sa réaction diffère nettement des autres segments.
Actionnable (Actionable) : on peut concevoir et exécuter des actions concrètes pour ce segment.
Stable (Stable) : c'est un segment qui ne disparaît pas à court terme, stable dans le temps.

Un segment « proprement séparé sur le plan statistique, mais sans moyen de l'atteindre et de petite taille » est juste comme analyse, mais inexploitable en entreprise. C'est au stade du profilage qu'on le passe au crible de ces six conditions.

7. Le point de vue de la rédaction — les cinq choses à ne pas faire en segmentation

En suivant en continu les cas du secteur et la parole des praticiens, voici cinq accidents qui se répètent en segmentation.

1. Classifier sans standardiser les variables

L'accident le plus fréquent et le moins repéré. Injecter dans un k-means, sans les standardiser, « le revenu (en milliers d'euros, de quelques milliers à plusieurs dizaines de milliers) » et « la satisfaction (de 1 à 5) » fait que les blocs se décident sur le seul revenu, à grande échelle, et la satisfaction est quasi ignorée. Avant de classifier, standardiser toutes les variables (scores z). Une analyse qui l'oublie est presque sûrement fausse.

2. Découper sur les seules variables démographiques et croire avoir segmenté

On s'arrête à « j'ai découpé entre 20–30, 30–40 et 40–50 ans ». Si, à découper par âge, les comportements d'achat sont identiques, ce n'est pas de la segmentation, juste de l'agrégation. Les variables démographiques ne sont pas un axe de découpage mais de profilage. Respecter l'ordre : découper sur le comportement et les besoins, décrire avec le démographique.

3. Décider du nombre de segments sur le seul indice statistique

Adopter 8 segments parce que le coefficient de silhouette y est maximal, puis les laisser à l'abandon faute de pouvoir les différencier. Prendre comme plafond « le nombre qu'on peut différencier », et laisser la statistique choisir l'optimum dans cette plage. 3 à 6 est l'atterrissage réaliste.

4. Réutiliser indéfiniment des segments une fois construits

Continuer d'utiliser des segments établis il y a deux ans, alors que le marché a changé. Les segments sont périssables. Quand le marché, les clients ou le produit changent, les blocs changent aussi. Refaire périodiquement la classification (une fois par an environ) et vérifier la stabilité des segments (condition 6).

5. Découper en segments malgré un petit échantillon

Répartir N=150 en 6 segments donne en moyenne 25 personnes par segment. Les scores par segment se truffent d'erreur : dire « le segment A a une satisfaction élevée » sur N=20 n'a aucun sens. Si l'on pose la segmentation en hypothèse, viser une conception d'échantillon assurant au minimum 50 à 100 par segment, et idéalement 100 ou plus chacun. Voir comment déterminer la taille d'échantillon nécessaire.

8. Mener une enquête de segmentation client avec l'outil de sondage Kicue

L'enquête de segmentation se scinde en une phase « mesurer les questions qui serviront de base au découpage » et une phase d'analyse « trouver les blocs par analyse typologique ». Kicue prend en charge la première ; la seconde se fait en combinaison avec des outils statistiques externes.

Mesure des variables de segmentation : prise en charge de la conception de questions à échelle de Likert et de questions à réponse unique/multiple pour mesurer besoins, valeurs et comportements (types de questions).
Questions démographiques et comportementales adjointes : recueil dans le même formulaire des attributs servant au profilage (tranche d'âge, formule, fréquence d'usage).
Export CSV avec identifiant de répondant : sortie au format « une ligne par réponse, toutes les questions alignées », directement injectable dans une analyse typologique. Après analyse, on peut aussi rapprocher du CRM « quel répondant appartient à quel segment ».
Agrégation GT et tris croisés : les tris croisés de la segmentation a priori (par tranche d'âge, etc.) sont possibles dans le tableau de bord.

⚠️ Ce que Kicue ne peut pas faire

Pas de fonction d'analyse typologique, de k-means, de classification hiérarchique ni d'analyse en classes latentes : l'analyse statistique se mène sous R (cluster, poLCA, etc.) / Python (scikit-learn) / SPSS / Latent GOLD. Kicue lui-même n'embarque pas de fonctions d'analyse statistique.
Pas d'analyse factorielle ni de standardisation des variables non plus : le prétraitement de classification se fait, après export, du côté du logiciel statistique.
Pas d'analyse des facteurs clés (KDA) par segment non plus : on transmet le CSV à un outil externe pour la rejouer segment par segment.
Pas de génération automatique de personas non plus : le passage aux personas à partir des résultats de profilage se fait à la main, avec un outil de BI.

Comme articles connexes, lire en parallèle le guide de l'analyse des facteurs clés, le guide de l'analyse importance-performance (IPA), le guide des méthodes d'échantillonnage d'enquête, le guide de conception et d'exploitation des questions de filtrage et le guide de la fidélité et de la validité des enquêtes : on voit alors se dessiner tout le pipeline analytique « conception → classement → analyse des facteurs par segment → priorisation ».

En résumé — six points pour faire de la segmentation client une analyse exploitable

Garder à l'esprit le piège de la moyenne globale — rejouer la KDA/IPA segment par segment révèle les différences cachées.
Découper sur le comportement et les besoins, décrire avec le démographique — le découpage démographique seul s'arrête au « j'ai cru segmenter ».
Toujours standardiser avant de classifier — pour que les variables à grande échelle ne s'emparent pas des blocs.
Le nombre de segments a pour plafond « le nombre qu'on peut différencier » — la statistique choisit l'optimum dans cette plage (3 à 6 est la réponse réaliste).
Passer au crible des six conditions (mesurable, accessible, substantielle, différenciable, actionnable, stable) — un bloc statistique ≠ un segment exploitable.
En hypothèse de segmentation, assurer 100 ou plus par segment — émietter un petit échantillon le truffe d'erreur.

La segmentation client n'a pas pour but « de faire tourner une analyse typologique sophistiquée ». En ne lâchant pas les trois points — standardisation, interprétabilité, faisabilité —, c'est une analyse qui sert de socle à la stratégie : elle permet de sortir de l'illusion du « client moyen » et de concevoir, bloc par bloc, des actions qui accrochent.

Vous souhaitez concevoir l'enquête qui servira de base à votre segmentation ? Essayez l'outil de sondage gratuit Kicue. Conception de questions à échelle de Likert et à choix pour mesurer besoins, comportements et attributs, export CSV avec identifiant de répondant : la partie « fabriquer les données d'entrée de l'analyse typologique » démarre depuis un seul compte (l'analyse typologique, l'analyse factorielle, l'analyse en classes latentes et la standardisation des variables s'exploitent en combinaison avec R / Python / SPSS / Latent GOLD).

Références

Smith, W. R. (1956). Product Differentiation and Market Segmentation as Alternative Marketing Strategies. Journal of Marketing, 21(1), 3-8.
Punj, G., & Stewart, D. W. (1983). Cluster Analysis in Marketing Research: Review and Suggestions for Application. Journal of Marketing Research, 20(2), 134-148.
Kamakura, W. A., & Russell, G. J. (1989). A Probabilistic Choice Model for Market Segmentation and Elasticity Structure. Journal of Marketing Research, 26(4), 379-390.
Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53-65.
Wedel, M., & Kamakura, W. A. (2000). Market Segmentation: Conceptual and Methodological Foundations (2nd ed.). Kluwer Academic Publishers.