Guía de análisis de factores clave (Key Driver Analysis) — Qué mueve la satisfacción y el NPS

Terminas de tabular la encuesta de satisfacción, tienes alineadas las puntuaciones por atributo y la satisfacción global. La siguiente pregunta es siempre la misma: «Quiero subir la satisfacción global. Entonces, ¿qué atributo tengo que mejorar para que suba?»

Y aquí es donde mucha gente lista los coeficientes de correlación entre cada atributo y la satisfacción global y reporta «los factores son los que tienen mayor correlación». Eso, a medias, es una trampa. La correlación solo dice que dos cosas «se mueven juntas», no garantiza que «si subes esto, sube la global». Y, además, cuando los atributos están correlacionados entre sí, se acaba contando dos y tres veces la misma importancia. El análisis de factores clave (Key Driver Analysis, KDA) es la técnica para desenredar estadísticamente esa «importancia aparente» y extraer los factores que de verdad influyen. En este artículo ordenamos, con la textura del oficio, desde los límites de la correlación hasta la multicolinealidad de la regresión múltiple, el valor de Shapley y los pesos relativos que la resuelven, y la regla de oro: «no confundir correlación con causalidad».

1. Qué es el análisis de factores clave — Cuantificar «qué influye»

El análisis de factores clave descompone cuánto puede explicarse una variable de resultado (satisfacción global, NPS, intención de continuidad, etc.) a partir de varias variables-factor (la satisfacción con cada atributo) y entrega, en cifras, el «grado de influencia (importancia)» de cada factor.

Por ejemplo, en una encuesta de satisfacción de un SaaS se toma la «satisfacción global» como variable dependiente y la «satisfacción con el soporte», la «satisfacción con las funciones», la «satisfacción con el precio» y la «satisfacción con la interfaz» como variables independientes, y se identifica cuál mueve con más fuerza la satisfacción global. Lo que sale es la «importancia derivada (derived importance)»: una importancia que no se pregunta directamente al encuestado, sino que se deduce estadísticamente a partir de los datos.

Esta importancia derivada es exactamente el concepto que apareció en la guía de análisis de importancia-desempeño (IPA) como una de las «formas de medir la importancia». Se calcula la importancia con el KDA y se coloca en los cuatro cuadrantes del IPA para decidir prioridades: los dos métodos están pensados para usarse en pareja (la conexión se detalla en el capítulo 7).

Los recuentos básicos de correlación y regresión se tratan en la guía de tabulación de encuestas y pruebas de significación. Este artículo va un paso más allá, como aplicación de aquello, para separar «qué influye entre varios factores».

2. Por qué «la lista de coeficientes de correlación» no basta

El KDA más sencillo consiste en calcular el coeficiente de correlación de Pearson entre cada factor y la satisfacción global y ordenarlos de mayor a menor. Se puede sacar incluso con la función COEF.DE.CORREL de Excel. Como cribado inicial para hacerse una idea es válido, pero si lo conviertes en conclusión final te equivocas por dos motivos.

Motivo 1: el «doble conteo» de la importancia

Los atributos suelen estar correlacionados entre sí. «La rapidez del soporte» y «la amabilidad del soporte» tienden a subir juntas. Si miras esos dos por separado con la correlación, ambos muestran una correlación alta. Pero la realidad puede ser que esté influyendo un único bloque, «la experiencia de soporte». La lista de correlaciones cuenta por duplicado la importancia de factores correlacionados entre sí y dibuja un cuadro distorsionado en el que «lo relacionado con el soporte acapara los primeros puestos».

Motivo 2: no tiene en cuenta los demás factores

La correlación mira «solo dos variables». Aunque «la correlación entre satisfacción con el precio y satisfacción global sea alta», no permite separar si lo que influye es el precio en sí o, en realidad, otro factor correlacionado con el precio (sensación de relación calidad-precio, expectativas).

Por eso surge la necesidad de considerar varios factores a la vez y extraer la contribución «pura» de cada uno. Eso es la regresión múltiple, que viene a continuación.

3. La regresión múltiple y la trampa de la «multicolinealidad»

La regresión múltiple explica la satisfacción global con todos los factores a la vez y toma los coeficientes beta estandarizados (β) como la importancia de cada factor. Permite obtener una contribución pura un paso por delante de la correlación: «manteniendo constantes los demás factores, cuando este factor se mueve una desviación estándar, la satisfacción global se mueve β desviaciones estándar».

Sin embargo, cuando usas la regresión múltiple en un KDA casi siempre caes en la trampa de la multicolinealidad (multicollinearity).

Qué ocurre con la multicolinealidad

Cuando los factores están fuertemente correlacionados entre sí (por ejemplo, rapidez y amabilidad del soporte con una correlación de 0,8), la regresión no puede decidir «de quién es el mérito» y los coeficientes se vuelven inestables. En concreto:

El signo del coeficiente se invierte (el coeficiente de «la rapidez del soporte», que debería ser importante, sale negativo)
Basta cambiar un poco la muestra para que los coeficientes oscilen mucho
El error estándar se infla y deja de ser significativo

Si en un comité de dirección reportas que «la rapidez del soporte tiene un efecto negativo sobre la satisfacción global», nadie te creerá. Y esa incredulidad es correcta: ese coeficiente negativo no es la realidad, sino un artefacto estadístico generado por la multicolinealidad.

Cómo detectarla

La multicolinealidad se detecta con el VIF (factor de inflación de la varianza, Variance Inflation Factor). Como referencia, se considera que un VIF superior a 5 exige cautela y uno superior a 10 indica claramente un problema. Con solo mirar la matriz de correlaciones entre atributos, cualquier par con correlación ≥ 0,7 ya es una señal de alarma.

El problema es que los atributos de satisfacción del cliente están correlacionados de forma estructural (un cliente satisfecho lo valora todo alto), de modo que la multicolinealidad no es algo que «ocurra de vez en cuando», sino que «ocurre casi siempre». Por eso, en el KDA no debes tomar los coeficientes de regresión en bruto como la importancia.

4. Resolver la multicolinealidad — El valor de Shapley y los pesos relativos

Los métodos para obtener una importancia estable evitando la multicolinealidad son los pesos relativos (Relative Weights) y el análisis del valor de Shapley. Este es hoy el estándar práctico del KDA.

Los 4 métodos del análisis de factores clave — El equilibrio entre precisión y sencillez

Análisis de correlación (Correlation)

Correlación de Pearson entre cada factor y la satisfacción global. Apto para un cribado inicial. Punto débil: ignora la correlación entre atributos y cuenta la importancia por duplicado. No usar como conclusión final.

Regresión múltiple (Multiple Regression)

Introduce todos los factores a la vez y usa la β estandarizada como importancia. Permite obtener la contribución pura, pero la multicolinealidad desestabiliza los coeficientes e invierte sus signos. Vigilar con el VIF.

Pesos relativos / valor de Shapley (Relative Weights / Shapley)

El estándar de la práctica. Reparte el poder explicativo (R²) de forma justa entre todos los factores. La importancia es no negativa y estable, y suma el R². Robusto ante la multicolinealidad. Requiere herramienta específica (relaimpo de R, etc.).

Importancia de variables de Random Forest (Random Forest)

Enfoque de aprendizaje automático que capta la no linealidad y las interacciones. Útil cuando la relación no es lineal. Punto débil: baja la interpretabilidad y aparece la sensación de caja negra.

La idea detrás del valor de Shapley y los pesos relativos

Ambos parten de una idea cercana: promediar, sobre todas las combinaciones posibles del orden en que se introducen las variables, cuánto aumenta el poder explicativo (R²) al añadir un factor como variable explicativa, y así obtener la contribución justa de cada factor. El valor de Shapley procede de la teoría de juegos y se conoce por Kruskal (1987) o como el método LMG; los pesos relativos de Johnson (2000) son una aproximación que reduce esa carga de cálculo.

La mayor ventaja práctica es que la importancia es siempre no negativa y su suma coincide con el R² del modelo. Salen cifras que se interpretan de forma intuitiva como porcentaje de contribución, del tipo «el soporte explica el 32 % del poder explicativo total, el precio el 21 %…». Te libera del infierno de tener que explicar una «importancia negativa» en un comité de dirección.

El cálculo es difícil con las funciones estándar de Excel; se realiza con el paquete relaimpo de R (Grömping 2006), con Python o con herramientas de análisis de encuestas específicas. Tonidandel & LeBreton (2011) ordenan, desde una óptica práctica, cómo el análisis de importancia relativa complementa de forma útil al análisis de regresión, y sirven como punto de partida para adoptarlo.

5. No confundir correlación con causalidad — El error más grave del KDA

Este es el punto en el que más se equivoca la gente, y de forma más fatal, en el análisis de factores clave. Lo que entrega el KDA es asociación (association), no causalidad (causation).

Un resultado como «la satisfacción con el soporte explica con fuerza la satisfacción global» no garantiza que «si mejoras el soporte, suba la satisfacción global». Siempre acechan las siguientes trampas.

Causalidad inversa (efecto halo)

Un cliente satisfecho en conjunto tiende a valorar también alto, sin pensarlo mucho, los atributos individuales (efecto halo). Entonces aparece una correlación del tipo «quien tiene la satisfacción global alta también valora bien el soporte», pero puede que no sea que «el soporte elevó la global», sino la relación inversa: «la satisfacción global elevó la valoración del soporte». El KDA por sí solo no puede determinar la dirección.

Confusión

También es posible que un tercer factor no observado (por ejemplo, el nivel de dominio del cliente o la afinidad) esté empujando hacia arriba al mismo tiempo tanto el soporte como la satisfacción global.

Cómo afrontarlo en la práctica

No reformules «factor» como «palanca que, si la mejoras, seguro que funciona». Limítate a la expresión «factor fuertemente vinculado a la satisfacción global»
Para los factores con mayor importancia, valida la causalidad, si es posible, con pruebas A/B o comparaciones antes-después de la intervención. El KDA es una priorización de «qué conviene validar», no una demostración de causalidad
Añade siempre en el informe la frase «esta es una importancia basada en asociación, no una garantía de efecto causal»

La humildad protege la fiabilidad del KDA. La forma correcta de decirlo no es «hemos encontrado los factores que funcionan», sino «hemos ordenado, de mayor a menor solidez, las hipótesis de qué parece estar funcionando».

6. Cómo elegir la variable de resultado y la «asimetría de la satisfacción»

Qué poner como variable dependiente

En el KDA la elección de la variable de resultado cambia la conclusión. ¿Satisfacción global? ¿NPS (intención de recomendación)? ¿Intención de continuidad? ¿Recompra? Cada una tiene factores distintos.

Si pones la satisfacción global como variable dependiente, salen «los factores que componen la experiencia actual»
Si pones la intención de continuidad / NPS como variable dependiente, salen «los factores que determinan el comportamiento futuro» (véase cómo leer el NPS y sus referencias)

Si persigues el fenómeno de «cancela aunque la satisfacción sea alta», la variable dependiente no debe ser la satisfacción, sino la intención de continuidad. Si la variable de resultado está desalineada respecto al objetivo, todo el análisis posterior cae en saco roto.

No pasar por alto la asimetría de la satisfacción (Kano)

La regresión normal asume una relación lineal en la que «si sube el factor, la global sube de forma proporcional», pero la realidad es asimétrica. Como ya señalamos con Matzler et al. (2004) en la guía de IPA:

Calidad obligatoria: se da por sentada. Si falta, la global baja mucho; pero satisfacerla no sube la global
Calidad atractiva: si no está, no genera insatisfacción; si está, la global se dispara

Para captarlo se usa el análisis de contraste penalización-recompensa (penalty-reward contrast analysis), que divide cada factor en una «variable ficticia de valoración alta» y una «variable ficticia de valoración baja» y hace la regresión. Permite distinguir los factores que «tienen una importancia alta, pero en realidad solo sirven para eliminar la insatisfacción (arreglarlos no sube la satisfacción)».

7. Conexión con el IPA — Colocar la salida del KDA en los cuatro cuadrantes

El análisis de factores clave y el análisis de importancia-desempeño (IPA) se conectan mediante una relación de entrada y salida.

Calcular la importancia derivada con el KDA: obtener el porcentaje de contribución de cada factor con el valor de Shapley / los pesos relativos (la materia prima del eje vertical)
Tabular la satisfacción (desempeño) de cada factor: media o Top 2 Box (la materia prima del eje horizontal)
Colocarlos en el diagrama de dispersión del IPA: eje vertical = importancia derivada del KDA, eje horizontal = satisfacción
Leer las prioridades en los cuatro cuadrantes: «importancia (KDA) alta pero satisfacción baja» = zona prioritaria de mejora

Con este flujo, la importancia derivada del KDA resuelve el punto débil del IPA: el problema de que «al medir la importancia con una pregunta directa, se aplasta por el efecto techo». El KDA construye el eje vertical y el IPA dibuja el mapa de decisión. KDA + IPA = la forma completa de priorizar mejoras.

Para medir el lado de la satisfacción (desempeño), consulta la guía de diseño de la satisfacción del cliente (CSAT); para el tamaño de muestra necesario, cómo determinar el tamaño de muestra de una encuesta.

8. La mirada editorial — 5 cosas que NO hacer en el análisis de factores clave

Desde la posición de quien sigue de forma continua los casos del sector y las voces de los profesionales, aquí van cinco accidentes que se repiten en el KDA.

1. Llamar «análisis de factores» a una lista de coeficientes de correlación

Es el más frecuente. Reportar como «hemos hecho un análisis de factores clave» algo que no es más que un orden por correlación de mayor a menor. Como la correlación cuenta por duplicado, un grupo de factores correlacionados entre sí (lo relacionado con el soporte, etc.) acapara de forma indebida los primeros puestos. El cribado inicial puede hacerse con la correlación, pero la conclusión hay que sacarla siempre con pesos relativos / Shapley.

2. Reportar el coeficiente negativo de la regresión tal cual

Poner en el informe, sin comprobarlo, el «coeficiente negativo de un factor que debería ser importante» que ha salido por la multicolinealidad. El lector detecta de un vistazo que «este análisis está mal». Comprueba siempre el VIF y, si hay colinealidad, cambia a pesos relativos. No conviertas los coeficientes de regresión en bruto en la salida final del KDA.

3. Afirmar que «factor = palanca que funciona si la mejoras»

El KDA es asociación, no causalidad. Una intervención afirmada como «el soporte es el mayor factor → si invertimos en soporte sube la satisfacción global» falla, y se pierde la confianza en el propio análisis: «me fié del análisis y…». Distingue con las palabras «fuerza del vínculo» y «efecto de la mejora», y valida la causalidad de los factores principales con pruebas A/B.

4. Poner por inercia la «satisfacción global» como variable de resultado

Si el objetivo es «reducir las cancelaciones» pero pones la satisfacción global como variable dependiente, suben a los primeros puestos factores que no tienen nada que ver con la cancelación. Elige la variable de resultado según el objetivo (satisfacción / continuidad / recomendación / recompra). Si decides esto por inercia, todo el análisis fino posterior será inútil.

5. No equilibrar el tamaño de muestra con el número de variables

Si haces una regresión con 30 variables explicativas y N=80, el sobreajuste hace que la importancia oscile de forma disparatada. Como referencia, conviene tener de 10 a 15 muestras por cada variable explicativa. Si hay demasiadas variables, comprime las dimensiones con un análisis factorial o agrúpalas con conocimiento del dominio antes de introducirlas.

9. Uso del análisis de factores clave con la herramienta de encuestas Kicue

El KDA se divide en «el diseño de las preguntas que miden factores y resultado» y «el análisis que calcula la importancia con pesos relativos, etc.». Kicue se ocupa de lo primero; lo segundo es una combinación con herramientas estadísticas externas.

Diseño de preguntas de factor y resultado: admite un diseño que mide, dentro del mismo formulario y con escalas Likert, la satisfacción con cada atributo (factores) y la satisfacción global / NPS / intención de continuidad (resultado) (tipos de pregunta y guía de diseño de escalas Likert)
Exportación de CSV con ID de encuestado: salida con una fila por respuesta, con la satisfacción por atributo y la satisfacción global alineadas, en una estructura lista para introducir directamente en un análisis de regresión
Tabulación general y tablas cruzadas: en el panel se puede comprobar la media y la distribución de cada factor, así como revisar los datos en bruto antes del cribado inicial de correlaciones

⚠️ Lo que Kicue no puede hacer

No tiene funciones para calcular correlación, regresión múltiple, pesos relativos ni valor de Shapley: el análisis estadístico se realiza con R (relaimpo, etc.) / Python / SPSS / JASP. Kicue en sí no incorpora funciones de análisis estadístico
Tampoco diagnostica el VIF ni la multicolinealidad: se hace en el software estadístico tras la exportación
Tampoco hace aprendizaje automático como random forest: se hace con Python (scikit-learn, etc.)
Tampoco crea el diagrama de dispersión del IPA: el diagrama con la importancia derivada del KDA en el eje vertical se dibuja con Excel / R / Python

Como artículos relacionados, si lees junto a este la guía de análisis de importancia-desempeño (IPA), la guía de diseño de la satisfacción del cliente (CSAT), cómo leer el NPS y sus referencias, la guía de tabulación de encuestas y pruebas de significación y la guía de diseño de un programa de VoC, verás todo el pipeline de análisis: «medir → identificar los factores que influyen (KDA) → priorizar (IPA) → operar».

Resumen — 6 puntos para convertir el análisis de factores clave en un análisis fiable

La lista de correlaciones, solo hasta el cribado inicial — como cuenta por duplicado, no la uses como conclusión
En la regresión múltiple, sospecha de la multicolinealidad — comprueba el VIF y no te creas a pies juntillas los coeficientes negativos
Saca la importancia con pesos relativos / Shapley — no negativa, suma el R², e interpretable como porcentaje de contribución
Distingue correlación de causalidad — es «fuerza del vínculo», no «garantía de efecto de mejora». Valida los principales con pruebas A/B
Ajusta la variable de resultado al objetivo — para frenar la cancelación, la intención de continuidad; para mejorar la experiencia, la satisfacción global
De 10 a 15 muestras por variable explicativa — si hay demasiadas variables, comprímelas con un análisis factorial

En el análisis de factores clave, la fiabilidad la determina, más que «qué método estadístico usas», no fallar en dos puntos: la multicolinealidad y la causalidad. Con solo respetar esos dos, se convierte en un arma potente para elevar la discusión de «por dónde empezar» desde la intuición hasta el terreno de las cifras.

Si quieres diseñar una encuesta que mida factores y resultado, ¿por qué no pruebas la herramienta de encuestas gratuita Kicue? Desde el diseño de preguntas Likert que miden la satisfacción por atributo y la satisfacción global / NPS en un mismo formulario hasta la exportación de CSV con ID de encuestado lista para introducir directamente en un análisis de regresión, puedes empezar con una sola cuenta la parte que crea los datos de entrada del análisis de factores clave (la correlación, la regresión múltiple, los pesos relativos, el valor de Shapley y el diagnóstico del VIF se operan en combinación con R / Python / SPSS / JASP).

Referencias

Johnson, J. W. (2000). A Heuristic Method for Estimating the Relative Weight of Predictor Variables in Multiple Regression. Multivariate Behavioral Research, 35(1), 1-19.
Kruskal, W. (1987). Relative Importance by Averaging Over Orderings. The American Statistician, 41(1), 6-10.
Grömping, U. (2006). Relative Importance for Linear Regression in R: The Package relaimpo. Journal of Statistical Software, 17(1), 1-27.
Tonidandel, S., & LeBreton, J. M. (2011). Relative Importance Analysis: A Useful Supplement to Regression Analysis. Journal of Business and Psychology, 26(1), 1-9.
Azen, R., & Budescu, D. V. (2003). The Dominance Analysis Approach for Comparing Predictors in Multiple Regression. Psychological Methods, 8(2), 129-148.