키 드라이버 분석 가이드 — 만족도·NPS를 움직이는 요인 찾기

만족도 조사 집계가 끝나고, 속성별 점수와 종합 만족도가 나란히 놓였다. 다음에 오는 질문은 늘 똑같다. "종합 만족도를 올리고 싶다. 그럼 어느 항목을 올리면 종합 만족도가 오르는가?"

여기서 많은 사람이 각 속성과 종합 만족도의 상관계수를 일람으로 만들어 "상관이 높은 순이 드라이버입니다" 라고 보고한다. 그건 절반은 함정이다. 상관은 "함께 움직이고 있다"는 것을 보고 있을 뿐, "여기를 올리면 종합이 오른다"고는 할 수 없다. 게다가 속성끼리 상관되어 있으면 같은 중요도를 이중·삼중으로 계상해 버린다. 키 드라이버 분석(Key Driver Analysis, KDA) 은 이 "겉보기 중요도"를 통계적으로 풀어내어, 정말로 효과 있는 요인을 끄집어내기 위한 기술이다. 이 글에서는 상관의 한계에서부터 다중회귀의 다중공선성, 그것을 푸는 섀플리 값·상대적 가중치, 그리고 "상관과 인과를 혼동하지 않는다"는 가장 중요한 작법까지를 실무의 손맛으로 정리한다.

1. 키 드라이버 분석이란 — "무엇이 효과 있는가"를 수치화한다

키 드라이버 분석은 하나의 아웃컴 변수(종합 만족도·NPS·지속 의향 등)를 여러 드라이버 변수(속성별 만족도)로 얼마나 설명할 수 있는가 를 분해하여, 각 드라이버의 "효과의 정도(중요도)"를 수치로 내는 분석이다.

예를 들어 SaaS 만족도 조사에서 "종합 만족도"를 종속변수로, "지원 만족도" "기능 만족도" "가격 만족도" "UI 만족도"를 독립변수로 두고, "종합 만족도를 가장 강하게 움직이는 것은 어느 것인가" 를 찾아낸다. 나오는 것은 "도출 중요도(derived importance)" —— 응답자에게 중요도를 직접 묻지 않고, 데이터로부터 통계적으로 도출한 중요도다.

이 도출 중요도는 지난번 중요도-만족도 분석(IPA) 가이드 에서 "중요도를 재는 법"으로 등장한 개념 그 자체다. KDA로 중요도를 산출하고, IPA의 4 사분면에 얹어 우선순위를 정한다 —— 이 둘은 짝으로 쓰는 것을 전제로 한 분석이다(제7장에서 접속을 자세히 다룬다).

상관·회귀의 기초적인 집계는 설문 집계와 유의차 판정 가이드 에서 다룬다. 이 글은 그 응용으로서, "여러 요인 중 무엇이 효과 있는가"를 가려내는 이야기로 파고든다.

2. 왜 "상관계수 일람"으로는 안 되는가

가장 손쉬운 KDA는 각 드라이버와 종합 만족도의 피어슨 상관계수 를 계산해 높은 순으로 나열하는 방법이다. Excel의 CORREL 함수로도 낼 수 있다. 어림을 잡는 1차 스크리닝으로는 유효하지만, 이것을 최종 결론으로 삼으면 두 가지 이유로 틀린다.

이유1: 중요도의 "이중 계상"

속성끼리는 대개 상관되어 있다. "지원의 빠름"과 "지원의 친절함"은 함께 높아지기 쉽다. 이 둘을 따로따로 상관으로 보면 둘 다 높은 상관 을 보인다. 그러나 실태는 "지원 경험"이라는 하나의 덩어리가 효과 있는 것뿐일지도 모른다. 상관 일람은 서로 상관하는 요인의 중요도를 중복해서 카운트 해 버려, "지원 관련이 상위를 독점"하는 일그러진 그림을 그린다.

이유2: 다른 요인을 고려하지 않는다

상관은 "2변수만" 본다. "가격 만족도와 종합 만족도의 상관이 높다"고 해도, 그것은 가격 그 자체가 아니라 가격과 상관하는 다른 요인(가성비 감각, 기대치) 이 효과 있을 가능성을 가려낼 수 없다.

그래서 여러 요인을 동시에 고려하여, 각 요인의 "순수한" 기여를 끄집어낼 필요가 생긴다. 그것이 다음의 다중회귀분석이다.

3. 다중회귀분석과 "다중공선성"이라는 덫

다중회귀분석은 종합 만족도를 모든 드라이버로 동시에 설명하고, 표준화 편회귀계수(β) 를 각 드라이버의 중요도로 보는 방법이다. "다른 요인을 일정하게 두었을 때, 이 요인이 1 표준편차 움직이면 종합 만족도가 β 표준편차 움직인다"는, 상관보다 한 걸음 나아간 순기여를 낼 수 있다.

그런데 KDA에서 다중회귀를 쓰면 거의 반드시 다중공선성(multicollinearity)의 덫 에 빠진다.

다중공선성이란 무엇이 일어나는가

드라이버끼리 강하게 상관되어 있으면(예: 지원의 빠름 과 친절함 이 상관 0.8), 회귀는 "어느 쪽의 공인가"를 정하지 못하고, 계수가 불안정해진다. 구체적으로는:

계수의 부호가 반전된다(중요할 터인 "지원의 빠름"의 계수가 마이너스 가 된다)
표본을 조금만 바꿔도 계수가 크게 흔들린다
표준오차가 부풀어 유의하지 않게 된다

경영 회의에서 "지원의 빠름은 종합 만족도에 마이너스 영향 이 있습니다"라고 보고하면 아무도 믿지 않는다. 그리고 그건 올바른 불신이다 —— 그 음(-)의 계수는 현실이 아니라 다중공선성이 낳은 통계적 아티팩트 이기 때문이다.

감지하는 법

다중공선성은 VIF(분산팽창계수, Variance Inflation Factor) 로 감지한다. 기준으로는 VIF가 5를 넘으면 경계, 10을 넘으면 명확히 문제 있다고 본다. 속성 간 상관행렬을 보는 것만으로도 상관 0.7 이상의 페어가 있으면 적신호다.

문제는 고객 만족도의 속성은 구조적으로 서로 상관한다(만족한 고객은 무엇이든 높게 평가한다)는 점이라, 다중공선성은 "가끔 일어나는" 것이 아니라 "거의 항상 일어나는" 점이다. 그래서 KDA에서는 날것의 다중회귀계수를 그대로 중요도로 삼아서는 안 된다.

4. 다중공선성을 푼다 — 섀플리 값과 상대적 가중치

다중공선성을 회피하면서 안정적인 중요도를 내기 위한 기법이 상대적 가중치(Relative Weights) 와 섀플리 값 분석 이다. 이것이 현재 KDA의 실무 표준이다.

키 드라이버 분석의 4가지 기법 — 정밀도와 손쉬움의 트레이드오프

상관 분석（Correlation）

각 드라이버와 종합 만족도의 피어슨 상관. 1차 스크리닝에 적합. 약점: 속성 간 상관을 무시하고 중요도를 이중 계상한다. 최종 결론에는 쓰지 않는다.

다중회귀분석（Multiple Regression）

모든 드라이버를 동시 투입해 표준화 β를 중요도로. 순기여를 낼 수 있다지만, 다중공선성으로 계수가 불안정해지고 부호가 반전된다. VIF로 요주의.

상대적 가중치 / 섀플리 값（Relative Weights / Shapley）

실무의 정석. 설명력(R²)을 모든 드라이버 사이에서 공평하게 분해. 중요도가 비음수로 안정적이고, 합계가 R²가 된다. 다중공선성에 강하다. 전용 도구 필요(R의 relaimpo 등).

랜덤 포레스트의 변수 중요도（Random Forest）

비선형·교호작용을 포착하는 머신러닝 접근법. 관계가 직선적이지 않을 때 유효. 약점: 해석성이 떨어지고 블랙박스 느낌이 난다.

섀플리 값·상대적 가중치의 발상

양자는 발상이 가까워, "어떤 드라이버를 설명변수에 더했을 때, 설명력(R²)이 얼마나 늘어나는가"를, 변수를 투입하는 순서의 모든 조합에 대해 평균하는 것으로 각 드라이버의 공평한 기여도를 낸다. 섀플리 값은 게임 이론에서 유래해 Kruskal (1987) 이나 LMG 법으로 알려져 있고, Johnson (2000) 의 상대적 가중치는 그 계산 부하를 줄인 근사다.

실무상 최대의 이점은 중요도가 반드시 비음수이며, 합계가 모델의 R²와 일치한다 는 것. "지원이 전체 설명력의 32%, 가격이 21%……"처럼 기여율로서 직관적으로 해석할 수 있는 숫자가 나온다. 경영 회의에서 "마이너스 중요도"를 설명하는 지옥에서 해방된다.

계산은 Excel 표준 기능으로는 어렵고, R의 relaimpo 패키지(Grömping 2006), Python, 전용 조사 분석 도구 등으로 수행한다. Tonidandel & LeBreton (2011) 은 상대 중요도 분석이 회귀분석의 유용한 보완이 됨을 실무 지향으로 정리하고 있어, 도입의 발판이 된다.

5. 상관과 인과를 혼동하지 않는다 — KDA 최대의 오독

여기가 키 드라이버 분석에서 가장 많이, 가장 치명적으로 틀리는 지점이다. KDA가 내는 것은 상관(association)이지 인과(causation)가 아니다.

"지원 만족도가 종합 만족도를 강하게 설명한다"는 결과는 "지원을 개선하면 종합 만족도가 오른다"를 보증하지 않는다. 다음의 함정이 늘 도사린다.

역방향의 인과(후광 효과)

종합적으로 만족하고 있는 고객은 개별 속성도 어쩐지 높게 평가 한다(후광 효과). 그러면 "종합 만족도가 높은 사람은 지원도 고평가"라는 상관이 나오지만, 이는 "지원이 종합을 올렸다"가 아니라 "종합적인 만족이 지원 평가를 떠받쳤다"는 역방향의 관계일지도 모른다. KDA만으로는 이 방향을 판정할 수 없다.

교란

지원과 종합 만족도 양쪽을, 관측하지 않은 제3의 요인(예: 고객의 숙련도, 궁합)이 동시에 밀어 올리고 있을 가능성도 있다.

실무에서 마주하는 법

"드라이버"를 "개선하면 반드시 효과 있는 레버"라고 바꿔 말하지 않는다. "종합 만족도와 강하게 연동하고 있는 요인"이라는 표현에 그친다
중요도 상위의 요인에 대해, 가능하면 A/B 테스트나 시책 전후 비교로 인과를 검증 한다. KDA는 "어디를 검증해야 하는가"의 우선순위 매김이지, 인과의 증명이 아니다
보고서에 "이것은 상관에 근거한 중요도이며, 인과 효과의 보증이 아니다"라는 한 문장을 반드시 덧붙인다

겸허함이 KDA의 신뢰성을 지킨다. "효과 있는 요인을 찾았다"가 아니라 "효과 있어 보이는 가설을, 근거가 강한 순으로 나열했다"가 정확한 표현이다.

6. 아웃컴 변수의 선택과 "만족의 비대칭성"

무엇을 종속변수에 둘 것인가

KDA는 아웃컴 변수의 선택으로 결론이 바뀐다. 종합 만족도인가, NPS(추천 의향)인가, 지속 의향인가, 재구매인가. 각각 드라이버가 다르다.

종합 만족도 를 종속변수로 하면 "지금의 경험을 구성하는 요인"이 나온다
지속 의향 / NPS 를 종속변수로 하면 "미래의 행동을 좌우하는 요인"이 나온다(NPS 읽는 법과 벤치마크 참조)

"만족도는 높은데 해지한다"는 현상을 좇는다면, 종속변수는 만족도가 아니라 지속 의향 이어야 한다. 목적에 대해 아웃컴 변수가 어긋나 있으면, 그 뒤의 분석이 모두 헛스윙한다.

만족의 비대칭성(Kano)을 놓치지 않는다

통상의 회귀는 "드라이버가 오르면 종합도 비례해서 오른다"는 직선 관계를 가정하지만, 현실은 비대칭이다. IPA 가이드의 Matzler et al. (2004) 에서도 다룬 대로:

당연 품질: 되어 있어 당연. 빠지면 종합이 크게 내려가지만, 충족해도 종합은 오르지 않는다
매력 품질: 없어도 불만은 없지만, 있으면 종합이 튀어오른다

이를 포착하려면 드라이버를 "고평가 더미" "저평가 더미"로 나누어 회귀하는 페널티-리워드 대비 분석(penalty-reward contrast analysis) 을 쓴다. "중요도가 높은데, 실은 불만 해소에만 효과 있는(고쳐도 만족은 오르지 않는)" 요인을 가려낼 수 있다.

7. IPA와의 접속 — KDA의 출력을 4 사분면에 얹는다

키 드라이버 분석과 중요도-만족도 분석(IPA) 은 입력과 출력의 관계 로 이어진다.

KDA로 도출 중요도를 산출: 섀플리 값 / 상대적 가중치로 각 드라이버의 기여율을 낸다(세로축의 재료)
각 드라이버의 만족도(퍼포먼스)를 집계: 평균값이나 Top 2 Box(가로축의 재료)
IPA의 산점도에 얹는다: 세로축=KDA의 도출 중요도, 가로축=만족도
4 사분면으로 우선순위를 읽는다: "중요도(KDA)는 높은데 만족도가 낮다"=중점 개선 영역

이 흐름으로 하면, IPA의 약점이었던 "중요도를 직접 질문으로 재면 천장 효과로 뭉개진다"는 문제를 KDA의 도출 중요도가 해결 한다. KDA가 세로축을 만들고, IPA가 의사결정의 지도를 그린다. KDA + IPA = 개선 우선순위 매김의 완성형 이다.

만족도(퍼포먼스) 쪽 측정법은 고객 만족도(CSAT) 설계 가이드, 필요한 표본 크기는 필요 표본 크기를 정하는 법 을 참조하기 바란다.

8. 편집부의 시점 — 키 드라이버 분석에서 해서는 안 되는 5가지

업계 사례와 실무 담당자의 목소리를 꾸준히 좇는 입장에서, KDA에서 반복해 일어나는 사고를 5가지.

1. 상관계수 일람을 "드라이버 분석"이라고 부른다

가장 빈번하다. 상관이 높은 순으로 나열했을 뿐인 것을 "키 드라이버 분석을 했습니다"라고 보고한다. 상관은 이중 계상하므로, 서로 상관하는 요인군(지원 관련 등)이 부당하게 상위를 독점 한다. 1차 스크리닝은 상관으로 좋지만, 결론은 반드시 상대적 가중치 / 섀플리로 낸다.

2. 다중회귀의 음(-)의 계수를 그대로 보고한다

다중공선성으로 나온 "중요할 터인 요인의 마이너스 계수"를, 검산 없이 리포트에 싣는다. 읽는 이는 단번에 "이 분석 이상하다"고 간파한다. VIF를 반드시 확인하고, 공선성이 있으면 상대적 가중치로 바꾼다. 날것의 회귀계수를 KDA의 최종 아웃풋으로 삼지 않는다.

3. "드라이버＝개선하면 효과 있는 레버"라고 단언한다

KDA는 상관이지 인과가 아니다. "지원이 최대 드라이버 → 지원에 투자하면 종합 만족이 오른다"고 단언한 시책이 헛스윙하고, "분석을 믿었는데"라며 분석 자체의 신뢰가 무너진다. "연동의 강함"과 "개선 효과"를 말로 구별하고, 상위 요인은 A/B 테스트로 인과를 검증한다.

4. 아웃컴 변수를 관성으로 "종합 만족도"로 한다

목적이 "해지를 줄인다"인데 종속변수를 종합 만족도로 하면, 해지와 무관한 드라이버가 상위에 온다. 목적(만족 / 지속 / 추천 / 재구매)에 따라 아웃컴 변수를 고른다. 여기를 관성으로 정하면, 그 뒤의 정교한 분석이 모두 무용지물이 된다.

5. 표본 크기와 변수의 수를 맞추지 않는다

설명변수가 30개나 되는데 N=80으로 회귀를 돌리면, 과적합으로 중요도가 엉터리로 흔들린다. 기준으로 설명변수 1개당 10〜15 표본 은 갖고 싶다. 변수가 너무 많다면 요인분석으로 차원을 압축하거나, 도메인 지식으로 그룹화한 뒤 투입한다.

9. 설문 도구 Kicue에서의 키 드라이버 분석 운영

KDA는 "드라이버와 아웃컴을 재는 설문 설계"와 "상대적 가중치 등으로 중요도를 산출하는 분석"으로 나뉜다. Kicue가 담당하는 것은 전자이고, 후자는 외부 통계 도구와의 조합이 된다.

드라이버·아웃컴 설문의 설계: 각 속성의 만족도(드라이버)와 종합 만족도 / NPS / 지속 의향(아웃컴)을, 동일 폼 안의 리커트 척도로 재는 설계에 대응(설문 타입·리커트 척도 설계 가이드)
응답자 ID 부착 CSV 익스포트: 1행 1응답으로 속성 만족도와 종합 만족도를 나란히 둔, 회귀분석에 그대로 투입할 수 있는 구조로 출력
GT 집계·교차 집계: 각 드라이버의 평균값·분포 확인, 상관의 1차 스크리닝 전 날 데이터 확인까지는 대시보드 상에서 가능

⚠️ Kicue에서 대응할 수 없는 범위

상관·다중회귀·상대적 가중치·섀플리 값의 계산 기능은 없음: 통계 해석은 R(relaimpo 등) / Python / SPSS / JASP 로 수행. Kicue 자체에는 통계 해석 기능을 두지 않았다
VIF·다중공선성의 진단도 없음: 익스포트 후의 통계 소프트웨어 측에서 수행
랜덤 포레스트 등의 머신러닝도 없음: Python(scikit-learn 등)으로 수행
IPA의 산점도 작성도 없음: KDA의 도출 중요도를 세로축에 두는 산점도는 Excel / R / Python으로 작도

관련 기사로 중요도-만족도 분석(IPA) 가이드·고객 만족도(CSAT) 설계 가이드·NPS 읽는 법과 벤치마크·설문 집계와 유의차 판정 가이드·VoC 프로그램 설계 가이드 를 함께 읽으면, "잰다 → 효과 있는 요인을 특정(KDA) → 우선순위(IPA) → 운영"의 분석 파이프라인 전체가 보인다.

정리 — 키 드라이버 분석을 신뢰할 수 있는 분석으로 만드는 6가지

상관 일람은 1차 스크리닝까지 — 이중 계상하므로 결론으로 삼지 않는다
다중회귀는 다중공선성을 의심한다 — VIF를 확인하고, 음(-)의 계수를 곧이곧대로 받아들이지 않는다
중요도는 상대적 가중치 / 섀플리로 낸다 — 비음수·합계가 R²로, 기여율로서 해석할 수 있다
상관과 인과를 구별한다 — "연동의 강함"이지 "개선 효과의 보증"이 아니다. 상위는 A/B 테스트로 검증
아웃컴 변수를 목적에 맞춘다 — 해지 대책이라면 지속 의향, 경험 개선이라면 종합 만족도
설명변수 1개당 10〜15 표본 — 변수가 너무 많다면 요인분석으로 압축

키 드라이버 분석은 "어느 통계 기법을 쓰는가"보다, 다중공선성과 인과의 2가지를 놓치지 않는 것 으로 신뢰성이 결정된다. 이 둘만 지키면, "무엇부터 손댈 것인가"의 논의를 감각론에서 숫자의 논의로 끌어올리는 강력한 무기가 된다.

드라이버와 아웃컴을 재는 조사를 설계하고 싶은 분은 무료 설문 도구 Kicue 를 시험해 보지 않으시겠습니까. 속성 만족도와 종합 만족도·NPS를 동일 폼에서 재는 리커트 설문 설계, 회귀분석에 그대로 투입할 수 있는 응답자 ID 부착 CSV 익스포트까지, 키 드라이버 분석의 입력 데이터를 만드는 부분을 1 계정으로 시작할 수 있습니다(상관·다중회귀·상대적 가중치·섀플리 값·VIF 진단은 R / Python / SPSS / JASP 와의 조합 운영이 됩니다).

참고 문헌

Johnson, J. W. (2000). A Heuristic Method for Estimating the Relative Weight of Predictor Variables in Multiple Regression. Multivariate Behavioral Research, 35(1), 1-19.
Kruskal, W. (1987). Relative Importance by Averaging Over Orderings. The American Statistician, 41(1), 6-10.
Grömping, U. (2006). Relative Importance for Linear Regression in R: The Package relaimpo. Journal of Statistical Software, 17(1), 1-27.
Tonidandel, S., & LeBreton, J. M. (2011). Relative Importance Analysis: A Useful Supplement to Regression Analysis. Journal of Business and Psychology, 26(1), 1-9.
Azen, R., & Budescu, D. V. (2003). The Dominance Analysis Approach for Comparing Predictors in Multiple Regression. Psychological Methods, 8(2), 129-148.