Guide de l'analyse des facteurs clés (Key Driver Analysis) — Ce qui fait bouger la satisfaction et le NPS

L'agrégation de l'enquête de satisfaction est bouclée, les scores par attribut et la satisfaction globale s'alignent. La question qui suit est toujours la même : « Je veux faire monter la satisfaction globale. Bon, quel critère faut-il relever pour que la globale monte ? »

Là, beaucoup de gens dressent la liste des coefficients de corrélation entre chaque attribut et la satisfaction globale et rapportent : « les facteurs, ce sont les attributs les plus corrélés ». C'est à moitié un piège. La corrélation observe seulement que deux choses « bougent ensemble » ; elle ne garantit pas que « relever ce point fera monter la globale ». Et lorsque les attributs sont corrélés entre eux, on comptabilise deux ou trois fois la même importance. L'analyse des facteurs clés (Key Driver Analysis, KDA) est la technique qui dénoue statistiquement cette « importance apparente » pour en extraire les facteurs qui pèsent réellement. Cet article met de l'ordre, avec le grain de la pratique, depuis les limites de la corrélation, en passant par la multicolinéarité de la régression multiple, la valeur de Shapley et les poids relatifs qui la dénouent, jusqu'à la règle d'or absolue : « ne pas confondre corrélation et causalité ».

1. Qu'est-ce que l'analyse des facteurs clés — chiffrer « ce qui pèse »

L'analyse des facteurs clés décompose dans quelle mesure une variable de résultat unique (satisfaction globale, NPS, intention de continuer, etc.) est expliquée par plusieurs variables-facteurs (la satisfaction sur chaque attribut) et chiffre le « degré d'efficacité (l'importance) » de chaque facteur.

Par exemple, dans une enquête de satisfaction d'un SaaS, on prend la « satisfaction globale » comme variable dépendante et la « satisfaction support », la « satisfaction fonctionnelle », la « satisfaction prix », la « satisfaction UI » comme variables indépendantes, et l'on identifie « lequel fait bouger le plus fortement la satisfaction globale ». Ce qui en sort, c'est l'« importance dérivée (derived importance) » — une importance que l'on n'a pas demandée directement au répondant mais déduite statistiquement des données.

Cette importance dérivée est exactement le concept apparu dans le précédent guide de l'analyse importance-performance (IPA) sous l'angle de « comment mesurer l'importance ». Calculer l'importance par la KDA, puis la reporter dans les 4 quadrants de l'IPA pour décider des priorités — ces deux analyses sont conçues pour aller de pair (le raccord est détaillé au chapitre 7).

Les agrégations de base de la corrélation et de la régression sont traitées dans le guide d'agrégation des enquêtes et de test de significativité. Le présent article en est l'application : on entre dans le détail du « démêlage de ce qui pèse parmi plusieurs facteurs ».

2. Pourquoi la « liste des coefficients de corrélation » ne suffit pas

La KDA la plus simple consiste à calculer le coefficient de corrélation de Pearson entre chaque facteur et la satisfaction globale, puis à les classer par ordre décroissant. On peut l'obtenir avec la fonction COEFFICIENT.CORRELATION d'Excel. C'est efficace comme premier filtrage pour se faire une idée, mais en faire la conclusion finale conduit à se tromper, pour deux raisons.

Raison 1 : le « double comptage » de l'importance

Les attributs sont, le plus souvent, corrélés entre eux. « La rapidité du support » et « la courtoisie du support » ont tendance à monter ensemble. Si on les regarde séparément en corrélation, les deux affichent une forte corrélation. Mais la réalité, c'est peut-être qu'un seul bloc — « l'expérience support » — fait effet. La liste des corrélations compte en double l'importance des facteurs corrélés et dessine une image biaisée du type « le support monopolise le haut du classement ».

Raison 2 : elle ne tient pas compte des autres facteurs

La corrélation ne regarde que « deux variables à la fois ». Même si « la satisfaction prix est fortement corrélée à la satisfaction globale », on ne peut pas démêler la possibilité que ce ne soit pas le prix lui-même mais un autre facteur corrélé au prix (le sentiment de bon rapport qualité-prix, les attentes) qui pèse.

D'où la nécessité de considérer plusieurs facteurs simultanément pour en extraire la contribution « pure ». C'est l'objet de la régression multiple qui suit.

3. La régression multiple et le piège de la « multicolinéarité »

La régression multiple explique la satisfaction globale par l'ensemble des facteurs simultanément et considère les coefficients bêta standardisés (β) comme l'importance de chaque facteur. Elle fournit une contribution pure, un cran au-dessus de la corrélation : « toutes choses égales par ailleurs, quand ce facteur bouge d'un écart-type, la satisfaction globale bouge de β écart-type ».

Seulement voilà, dès qu'on emploie la régression multiple en KDA, on tombe presque toujours dans le piège de la multicolinéarité (multicollinearity).

Que se passe-t-il en cas de multicolinéarité

Lorsque les facteurs sont fortement corrélés entre eux (ex. : rapidité du support et courtoisie corrélées à 0,8), la régression ne parvient pas à décider « à qui revient le mérite » et les coefficients deviennent instables. Concrètement :

le signe du coefficient s'inverse (le coefficient de « la rapidité du support », censé être important, devient négatif)
il suffit de changer légèrement l'échantillon pour que les coefficients fluctuent fortement
l'erreur type gonfle et l'effet cesse d'être significatif

Si vous rapportez en comité de direction que « la rapidité du support a un impact négatif sur la satisfaction globale », personne ne vous croira. Et cette défiance est justifiée — car ce coefficient négatif n'est pas la réalité mais un artefact statistique engendré par la multicolinéarité.

Comment la détecter

La multicolinéarité se détecte avec le VIF (facteur d'inflation de la variance, Variance Inflation Factor). En règle générale, on se méfie dès que le VIF dépasse 5, et on considère qu'il y a clairement problème au-delà de 10. Même un simple coup d'œil à la matrice de corrélation entre attributs suffit : toute paire à corrélation ≥ 0,7 est un signal d'alerte.

Le hic, c'est que les attributs de satisfaction client sont structurellement corrélés (un client satisfait note tout très haut), de sorte que la multicolinéarité ne survient pas « de temps en temps » mais « quasiment toujours ». C'est pourquoi, en KDA, il ne faut pas prendre tels quels les coefficients bruts de la régression comme importance.

4. Dénouer la multicolinéarité — valeur de Shapley et poids relatifs

Les méthodes qui produisent une importance stable tout en contournant la multicolinéarité sont les poids relatifs (Relative Weights) et l'analyse par valeur de Shapley. C'est le standard actuel de la KDA en pratique.

Les 4 méthodes de l'analyse des facteurs clés — l'arbitrage précision / simplicité

Analyse de corrélation (Correlation)

Corrélation de Pearson entre chaque facteur et la satisfaction globale. Adaptée au premier filtrage. Faiblesse : ignore la corrélation entre attributs et compte l'importance en double. À ne pas utiliser comme conclusion finale.

Régression multiple (Multiple Regression)

Tous les facteurs sont introduits simultanément, le β standardisé sert d'importance. Fournit une contribution pure, mais la multicolinéarité déstabilise les coefficients et inverse les signes. À surveiller avec le VIF.

Poids relatifs / valeur de Shapley (Relative Weights / Shapley)

Le standard de la pratique. Décompose équitablement le pouvoir explicatif (R²) entre tous les facteurs. L'importance est non négative, stable, et sa somme égale le R². Robuste à la multicolinéarité. Requiert un outil dédié (relaimpo sous R, etc.).

Importance des variables de la forêt aléatoire (Random Forest)

Approche d'apprentissage automatique captant non-linéarités et interactions. Efficace quand la relation n'est pas linéaire. Faiblesse : l'interprétabilité baisse, une impression de boîte noire s'installe.

L'idée de la valeur de Shapley et des poids relatifs

Les deux relèvent d'une logique voisine : elles produisent la contribution équitable de chaque facteur en moyennant, sur toutes les combinaisons d'ordre d'introduction des variables, « de combien le pouvoir explicatif (R²) augmente lorsqu'on ajoute un facteur comme variable explicative ». La valeur de Shapley vient de la théorie des jeux, connue à travers Kruskal (1987) ou la méthode LMG ; les poids relatifs de Johnson (2000) en sont une approximation qui en allège la charge de calcul.

Le plus grand avantage en pratique : l'importance est toujours non négative et sa somme coïncide avec le R² du modèle. On obtient des chiffres interprétables intuitivement comme des parts de contribution — « le support représente 32 % du pouvoir explicatif total, le prix 21 %… ». Fini l'enfer d'avoir à expliquer une « importance négative » en comité de direction.

Le calcul est difficile avec les fonctions standard d'Excel ; il se réalise avec le package relaimpo de R (Grömping 2006), Python, ou des outils d'analyse d'enquête dédiés. Tonidandel & LeBreton (2011) présentent, sous un angle proche de la pratique, en quoi l'analyse d'importance relative complète utilement la régression — un bon point d'entrée pour s'y mettre.

5. Ne pas confondre corrélation et causalité — la pire mésinterprétation de la KDA

C'est ici que se commet l'erreur la plus fréquente et la plus fatale de l'analyse des facteurs clés. Ce que produit la KDA, c'est de l'association, pas de la causalité (causation).

Le résultat « la satisfaction support explique fortement la satisfaction globale » ne garantit pas que « améliorer le support fera monter la satisfaction globale ». Les écueils suivants guettent toujours.

Causalité inversée (effet de halo)

Un client globalement satisfait note vaguement haut chaque attribut pris isolément (effet de halo). Apparaît alors la corrélation « les gens à forte satisfaction globale notent aussi haut le support », mais ce n'est peut-être pas « le support a fait monter la globale » : la relation inverse — « la satisfaction globale a rehaussé l'évaluation du support » — est tout aussi plausible. La KDA seule ne peut pas trancher ce sens.

Confusion (variable confondante)

Il se peut aussi qu'un troisième facteur non observé (ex. : le degré de maîtrise du client, l'affinité) pousse simultanément à la hausse le support et la satisfaction globale.

Comment s'y prendre en pratique

Ne pas reformuler le « facteur » en « levier qui marchera à coup sûr si on l'améliore ». S'en tenir à l'expression « facteur fortement corrélé à la satisfaction globale »
Pour les facteurs en tête de l'importance, vérifier la causalité, si possible, par un test A/B ou une comparaison avant/après action. La KDA est une hiérarchisation du « où vérifier », pas une preuve de causalité
Toujours joindre au rapport la phrase « il s'agit d'une importance fondée sur la corrélation et non d'une garantie d'effet causal »

L'humilité protège la fiabilité de la KDA. La formulation juste n'est pas « j'ai trouvé les facteurs qui pèsent » mais « j'ai classé, du plus solidement étayé au moins, les hypothèses de facteurs susceptibles de peser ».

6. Choisir la variable de résultat et l'« asymétrie de la satisfaction »

Que placer en variable dépendante

En KDA, le choix de la variable de résultat change la conclusion. Satisfaction globale ? NPS (intention de recommander) ? Intention de continuer ? Réachat ? Les facteurs diffèrent pour chacun.

prendre la satisfaction globale en variable dépendante fait ressortir « les facteurs qui composent l'expérience actuelle »
prendre l'intention de continuer / le NPS fait ressortir « les facteurs qui orientent le comportement futur » (voir comment lire le NPS et ses benchmarks)

Si vous traquez le phénomène « la satisfaction est haute mais le client résilie », la variable dépendante doit être non pas la satisfaction mais l'intention de continuer. Quand la variable de résultat est décalée par rapport à l'objectif, tout le reste de l'analyse tombe à côté.

Ne pas passer à côté de l'asymétrie de la satisfaction (Kano)

La régression ordinaire suppose une relation linéaire « plus le facteur monte, plus la globale monte proportionnellement », mais la réalité est asymétrique. Comme évoqué dans le Matzler et al. (2004) du guide IPA :

Qualité attendue : va de soi quand elle est là. Son absence fait fortement chuter la globale, mais la satisfaire ne la fait pas monter
Qualité attractive : son absence ne crée pas d'insatisfaction, mais sa présence fait bondir la globale

Pour la capter, on utilise l'analyse de contraste pénalité-récompense (penalty-reward contrast analysis), qui scinde chaque facteur en « variable indicatrice de note haute » et « variable indicatrice de note basse » avant de régresser. On distingue alors les facteurs « à forte importance mais qui, en réalité, ne servent qu'à lever l'insatisfaction (les corriger ne fait pas monter la satisfaction) ».

7. Le raccord avec l'IPA — reporter la sortie de la KDA dans les 4 quadrants

L'analyse des facteurs clés et l'analyse importance-performance (IPA) s'articulent dans un rapport d'entrée à sortie.

Calculer l'importance dérivée par la KDA : produire la part de contribution de chaque facteur par valeur de Shapley / poids relatifs (la matière de l'axe vertical)
Agréger la satisfaction (performance) de chaque facteur : moyenne, Top 2 Box (la matière de l'axe horizontal)
Reporter sur le nuage de points de l'IPA : ordonnée = importance dérivée de la KDA, abscisse = satisfaction
Lire les priorités en 4 quadrants : « importance (KDA) élevée mais satisfaction faible » = zone d'amélioration prioritaire

Ce flux fait que la faiblesse de l'IPA — le problème de l'écrasement de l'importance par effet de plafond quand on la mesure par une question directe — est résolu par l'importance dérivée de la KDA. La KDA construit l'axe vertical, l'IPA dessine la carte de décision. KDA + IPA = la forme aboutie de la hiérarchisation des priorités d'amélioration.

Pour la mesure du côté satisfaction (performance), voir le guide de conception de la satisfaction client (CSAT) ; pour la taille d'échantillon nécessaire, comment déterminer la taille d'échantillon nécessaire.

8. Le point de vue de la rédaction — 5 choses à ne pas faire en analyse des facteurs clés

Du point de vue de qui suit en continu les cas du secteur et la parole des praticiens, voici 5 accidents qui se répètent en KDA.

1. Appeler « analyse de facteurs » une simple liste de coefficients de corrélation

Le plus fréquent. Rapporter « j'ai fait une analyse des facteurs clés » alors qu'on a juste classé par corrélation décroissante. Comme la corrélation compte en double, un groupe de facteurs corrélés (le support et ses dérivés, par ex.) monopolise indûment le haut du classement. Le premier filtrage peut se faire à la corrélation, mais la conclusion doit toujours sortir des poids relatifs / de la valeur de Shapley.

2. Rapporter tel quel un coefficient négatif de la régression

Mettre dans le rapport, sans vérification, le « coefficient négatif d'un facteur censé être important » sorti de la multicolinéarité. Le lecteur repère d'emblée que « cette analyse cloche ». Vérifier impérativement le VIF et, en cas de colinéarité, basculer sur les poids relatifs. Ne pas faire du coefficient brut de régression la sortie finale de la KDA.

3. Affirmer que « facteur = levier qui marche si on l'améliore »

La KDA, c'est de la corrélation, pas de la causalité. Une action affirmée comme « le support est le premier facteur → investir dans le support fera monter la satisfaction globale » tombe à côté, et « on a cru l'analyse, pourtant… » fait perdre toute confiance dans l'analyse elle-même. Distinguer par les mots « la force du lien » et « l'effet d'amélioration », et vérifier la causalité des facteurs de tête par un test A/B.

4. Mettre par habitude la « satisfaction globale » en variable de résultat

Si l'objectif est de « réduire la résiliation » mais que la variable dépendante est la satisfaction globale, des facteurs sans rapport avec la résiliation remontent en tête. Choisir la variable de résultat selon l'objectif (satisfaction / continuité / recommandation / réachat). La fixer par habitude rend vaine toute la finesse de l'analyse qui suit.

5. Ne pas équilibrer taille d'échantillon et nombre de variables

Faire tourner une régression à 30 variables explicatives sur N=80 fait fluctuer l'importance n'importe comment, par surapprentissage. En règle générale, on veut 10 à 15 réponses par variable explicative. Si les variables sont trop nombreuses, compresser la dimension par analyse factorielle, ou les regrouper par connaissance métier avant de les introduire.

9. Mettre en œuvre l'analyse des facteurs clés avec l'outil d'enquête Kicue

La KDA se scinde en une « conception de questions mesurant facteurs et résultat » et une « analyse calculant l'importance par poids relatifs, etc. ». Ce que Kicue prend en charge, c'est la première ; la seconde se fait en combinaison avec des outils statistiques externes.

Conception des questions facteurs et résultat : prise en charge d'un design mesurant, dans un même formulaire et sur une échelle de Likert, la satisfaction de chaque attribut (les facteurs) et la satisfaction globale / le NPS / l'intention de continuer (le résultat) (types de questions · guide de conception de l'échelle de Likert)
Export CSV avec identifiant de répondant : sortie structurée en une ligne par réponse, alignant satisfaction par attribut et satisfaction globale, prête à être injectée telle quelle dans une régression
Agrégation GT · tri croisé : la vérification de la moyenne et de la distribution de chaque facteur, ainsi que le contrôle des données brutes avant le premier filtrage par corrélation, sont possibles dans le tableau de bord

⚠️ Ce que Kicue ne prend pas en charge

Pas de fonction de calcul de la corrélation, de la régression multiple, des poids relatifs ni de la valeur de Shapley : l'analyse statistique se fait avec R (relaimpo, etc.) / Python / SPSS / JASP. Kicue lui-même n'embarque pas de fonction d'analyse statistique
Pas de diagnostic du VIF ni de la multicolinéarité : à réaliser, après export, dans le logiciel statistique
Pas d'apprentissage automatique de type forêt aléatoire : à réaliser sous Python (scikit-learn, etc.)
Pas de tracé du nuage de points IPA : le nuage plaçant l'importance dérivée de la KDA en ordonnée se construit sous Excel / R / Python

En articles connexes, lire conjointement le guide de l'analyse importance-performance (IPA), le guide de conception de la satisfaction client (CSAT), comment lire le NPS et ses benchmarks, le guide d'agrégation des enquêtes et de test de significativité et le guide de conception d'un programme VoC fait apparaître l'ensemble du pipeline analytique « mesurer → identifier les facteurs qui pèsent (KDA) → prioriser (IPA) → mettre en exploitation ».

Conclusion — 6 points pour faire de l'analyse des facteurs clés une analyse fiable

La liste des corrélations s'arrête au premier filtrage — elle compte en double, n'en faites pas une conclusion
Soupçonner la multicolinéarité en régression multiple — vérifier le VIF, ne pas gober les coefficients négatifs
Sortir l'importance par poids relatifs / valeur de Shapley — non négative, somme égale au R², interprétable comme part de contribution
Distinguer corrélation et causalité — c'est « la force du lien », pas « la garantie d'un effet d'amélioration ». Vérifier les facteurs de tête par test A/B
Aligner la variable de résultat sur l'objectif — intention de continuer pour lutter contre la résiliation, satisfaction globale pour améliorer l'expérience
10 à 15 réponses par variable explicative — compresser par analyse factorielle si les variables sont trop nombreuses

En analyse des facteurs clés, la fiabilité se joue moins sur « quelle méthode statistique employer » que sur le fait de ne rater ni la multicolinéarité ni la causalité. À condition de tenir ces deux points, elle devient une arme puissante qui élève le débat sur « par quoi commencer » du registre de l'intuition à celui des chiffres.

Vous voulez concevoir une enquête mesurant facteurs et résultat ? Pourquoi ne pas essayer l'outil d'enquête gratuit Kicue ? De la conception des questions de Likert mesurant dans un même formulaire la satisfaction par attribut et la satisfaction globale / le NPS, jusqu'à l'export CSV avec identifiant de répondant prêt à être injecté tel quel dans une régression, vous pouvez démarrer avec un seul compte la partie qui produit les données d'entrée de l'analyse des facteurs clés (la corrélation, la régression multiple, les poids relatifs, la valeur de Shapley et le diagnostic du VIF s'exploitent en combinaison avec R / Python / SPSS / JASP).

Références

Johnson, J. W. (2000). A Heuristic Method for Estimating the Relative Weight of Predictor Variables in Multiple Regression. Multivariate Behavioral Research, 35(1), 1-19.
Kruskal, W. (1987). Relative Importance by Averaging Over Orderings. The American Statistician, 41(1), 6-10.
Grömping, U. (2006). Relative Importance for Linear Regression in R: The Package relaimpo. Journal of Statistical Software, 17(1), 1-27.
Tonidandel, S., & LeBreton, J. M. (2011). Relative Importance Analysis: A Useful Supplement to Regression Analysis. Journal of Business and Psychology, 26(1), 1-9.
Azen, R., & Budescu, D. V. (2003). The Dominance Analysis Approach for Comparing Predictors in Multiple Regression. Psychological Methods, 8(2), 129-148.