"NPS, CSAT, CES — 어느 것을 써야 하나요?" CX 또는 CS 영역에 들어선 사람이라면 반드시 한 번은 마주치는 질문이다. 셋 다 "고객의 목소리를 수치화하는" 지표지만, 각각 측정하는 것이 미묘하게 다르다. 그런데도 많은 현장은 이 차이를 명확히 하지 않은 채 "일단 NPS 도입", "CSAT도 병행"으로 달려가, 결국 어떤 의사결정에도 쓸 수 없는 숫자들이 쌓인다.
본 글에서는 3 가지 지표가 무엇을 측정하는가, 언제 무엇을 쓸 것인가, 기업 단계별 우선순위, 자주 발생하는 3 가지 실수, 그리고 편집부의 실천 지침을 Reichheld (2003) NPS 원전, Dixon et al. (2010) CES 원전, 학술적 비판 문헌을 바탕으로 정리한다. 기존의 NPS·CSAT·CES 개별 글을 "횡단적으로 사용 구분하기 위한 hub" 로 위치시킨 글이다.
1. 왜 "지표 선택"에서 실패하는가
CX 지표 도입에서 가장 흔한 실패 패턴은 "전부 한다"는 결정이다.
- "NPS를 측정하자" → 경영 회의에서 보고하기 위해
- "CSAT도 병행으로" → 서포트 품질을 보고 싶으니까
- "CES도 하자" → Gartner가 좋다고 했으니까
결과: 전사적으로 3 가지 지표가 따로따로 수집되고, 어느 것을 축으로 무엇을 개선해야 하는지 아무도 모르게 된다. 이것은 "KPI 희석"이라 불리는 전형적 실패로, Hayes (2008) Measuring Customer Satisfaction and Loyalty 도 "지표 수가 늘수록 조직의 개선 활동은 느려진다"고 지적한다.
지표를 "무엇을 위해, 어느 터치포인트에서, 누구의 의사결정에 쓸 것인가"를 정하지 않은 채 병행시키면, 3 개의 숫자가 단지 나란히 있는 대시보드가 만들어진다.
2. 3 가지 지표는 각각 무엇을 측정하는가
3 지표의 차이는 측정하는 "구성 개념(construct)" 의 차이이다.
NPS (Net Promoter Score) — 충성도·추천 의향
Reichheld, F. F. (2003) The One Number You Need to Grow (HBR) 가 제안. "당신은 우리 회사를 친구나 동료에게 추천할 가능성이 얼마나 됩니까? 0~10으로" 라는 1 문항으로 측정한다.
- 구성 개념: 충성도 / 추천 의향
- 출력: −100 ~ +100 의 점수 (추천자 % − 비추천자 %)
- 강점: 연도 간 비교가 쉽고, 경영진 보고가 간단
- 약점: 계산 방식에 대한 학술적 비판이 누적 (Keiningham et al. 2007)
CSAT (Customer Satisfaction Score) — 거래·체험의 만족도
기원은 단일 논문이 아니다. Oliver (1980) A Cognitive Model of the Antecedents and Consequences of Satisfaction Decisions 의 기대 불일치 이론을 토대로 198090 년대에 널리 보급되었다. "이번 ◯◯에 얼마나 만족하셨습니까? 15로" 로 측정한다.
- 구성 개념: 만족도 (기대와 실제의 차이)
- 출력: 평균값 (예: 4.2 / 5.0) 또는 만족자율 (4 점 이상 비율)
- 강점: 터치포인트 직후의 체험을 즉시 측정 가능
- 약점: 문화 차이·척도 차이로 연도 간 비교가 어렵다
CES (Customer Effort Score) — 마찰·노력
Dixon, M., Freeman, K., & Toman, N. (2010) Stop Trying to Delight Your Customers (HBR) 가 제안. 75,000명 규모의 조사를 바탕으로 "고객을 감동시키지 마라. 노력을 줄여라" 라고 주장. "이 문제를 해결하는 데 얼마나 노력이 들었습니까? 1 (매우 적음) ~ 7 (매우 많음)" 로 측정한다.
- 구성 개념: 고객의 노력 (effort) = 마찰
- 출력: 평균값 또는 "노력이 적었다 (5 이상)" 비율
- 강점: 서포트 이탈 예방에 직결 (높은 CES = 이탈 전조)
- 약점: 관계 전체의 평가에는 적합하지 않음
즉 3 개는 "다른 것"을 측정한다
| 지표 | 측정 대상 | 측정 시점 | 주요 이용 부문 |
|---|---|---|---|
| NPS | 충성도·추천 의향 | 관계 측정 (연 1~4 회) | 경영진·마케팅 |
| CSAT | 거래·체험의 만족도 | 터치포인트 직후 | CS·프로덕트 |
| CES | 과제 해결 시의 노력 | 서포트 대응 직후 | 서포트·고객 성공 |
"어느 것이 우수한가"가 아니라 "어느 의사결정에 어느 지표가 답하는가" 로 선택한다.
3. 언제 무엇을 쓸 것인가 — 터치포인트별 선택
관계 측정 → NPS
분기 / 반기 / 연 단위로 "자사 전체 평가"를 정점 관측하고 싶다면 NPS 가 1 순위다. 1 문항으로 끝나 응답 부담이 낮고 연도 간 비교에 적합하다. 경영 회의에서 "자사의 고객 충성도가 전년 대비 개선되었는가"를 말할 때 가장 많이 쓰이는 이유이다.
다만 NPS 만으로 업적을 예측할 수 있다는 주장에는 학술적 비판이 많다 (NPS 글 에서 상세히 다룸). NPS 의 숫자는 "방향감"으로 쓰고, 업적 예측에는 다른 데이터와 조합한다 가 현실적이다.
거래 측정 → CSAT
"지난 주 온보딩 체험이 어땠는가", "이번 구매가 매끄러웠는가" 등 특정 터치포인트 직후의 평가에는 CSAT 이 적합하다. NPS 로 관계 전체를 보고, CSAT 으로 각 터치포인트를 파고드는 구조가 일반적이다.
CSAT 은 5 단계 리커트가 주류 (리커트 척도 설계 참조). 질문문의 wording 에 따라 스코어가 10~20% 움직이므로, 운용에서는 wording 의 고정이 필수이다.
개별 터치포인트의 마찰 측정 → CES
"서포트 티켓 해결 후", "신청 플로우 완료 직후" 등 마찰이 일어나기 쉬운 터치포인트에 CES 가 위력을 발휘한다. 높은 CES (노력이 많이 든) 고객은 다음 갱신에서 4 배 이탈하기 쉽다 는 Dixon et al. (2010) 의 발견이 CES 를 CS 부문의 필수 지표로 끌어올렸다.
CES 는 "모든 터치포인트"에서 측정하는 것이 아니라, 마찰 리스크가 높은 1~2 포인트로 좁힌다 가 정석이다. 모든 곳에 붙이면 응답 부담이 올라가, 본래 노려야 할 터치포인트의 숫자가 옅어진다.
4. 기업 단계별 우선순위
"전부 한다"가 실패한다면 단계별로 우선순위를 바꾸는 것이 현실적이다.
스타트업 초기 (PMF 이전)
- 제 1 우선: CSAT — 체험의 즉시 개선이 최우선. NPS 는 N 이 너무 작아 의미 있는 스코어가 나오지 않는다. CES 도 아직 서포트 조직이 작은 단계에서는 과잉.
- 수집 방법: 온보딩 완료 직후 + 첫 구매 후의 2 포인트에서 CSAT 을 5 단계로 측정.
PMF 이후·성장기
- 제 1 우선: NPS — 입소문과 재구매 예측 지표로서 가치가 나타나기 시작.
- 제 2 우선: CSAT — 주요 터치포인트 3~5 개에서 병행.
- 수집 방법: NPS 는 분기 1 회, CSAT 은 터치포인트 직후 상시.
성숙기 / 엔터프라이즈
- NPS + CSAT + CES 의 3 층 구조가 기능한다.
- NPS: 경영 보고 (연 2~4 회).
- CSAT: 프로덕트 개선 (터치포인트별, 상시).
- CES: 서포트 / 성공 조직 (개별 티켓, 상시).
- 중요: 대시보드에서 섞지 말고, 역할을 나눈 채 개별로 운용한다.
"병행한다"와 "섞는다"는 다른 것이다. 역할을 나눈 채 병행하는 것은 정답, 대시보드에 3 개 나란히 놓고 평균을 내는 것은 오답.
5. 자주 발생하는 3 가지 실수
실수 1: NPS 만으로 업적을 예측한다
"NPS 가 오르면 매출이 오른다"고 믿고 다른 리딩 지표 (CSAT·CES·해약률·확장률)를 보지 않게 된다. 이것이 NPS 의 최대 오용이다. Keiningham et al. (2007) A Longitudinal Examination of Net Promoter and Firm Revenue Growth 는 NPS 단독으로는 업적과의 인과관계가 약함을 실증했다.
NPS 는 "방향감"을 보여준다. 업적 예측에는 NPS + 해약률 + 확장률 + 코호트별 LTV 등 여러 가지를 조합한다.
실수 2: 3 지표를 다 측정하고 개선이 없다
"NPS 도 CSAT 도 CES 도 측정했습니다" → "숫자는 보고 있습니다" → "그래서 무엇을 개선했나?"에 답하지 못한다.
지표를 측정하는 목적은 "숫자를 갖는 것"이 아니라 "개선을 일으키는 것". 3 지표를 병행하려면 각각의 소유자(owner)와 개선 PDCA 를 나누는 것이 필수이다. 소유자가 같으면 결국 어느 하나의 숫자만 쫓고 나머지는 버려진다.
실수 3: 대시보드에서 평균화한다
"NPS = 30 / CSAT = 4.2 / CES = 5.5 → 전체 CX 스코어 = 75" 같은 지표 평균화는 구성 개념이 다른 것을 더하는 것이라 의미 없는 숫자를 만든다.
섞지 말고 3 개의 숫자를 별도의 그래프로 보고, 각각 독립으로 개선한다가 정석. 경영진 보고에서는 "충성도 (NPS)는 개선, 만족도 (CSAT)는 보합, 마찰 (CES)은 악화" 처럼 3 개의 서로 다른 스토리를 말한다가 정답이다.
6. 편집부의 시각 — 5 가지 실천 지침
업계 문헌과 현장 운용을 바탕으로 편집부가 반드시 지키는 5 가지.
1. 지표 선택의 의사결정 기준을 "터치포인트 × 역할"로 적어 둔다. "경영 보고에 무엇이 필요한가", "프로덕트 개선에 무엇이 필요한가", "서포트 개선에 무엇이 필요한가"를 먼저 적는다. 3 가지 질문에 같은 지표가 나오면 경계한다. 경영 보고와 CS 개선에서 같은 NPS 를 돌려쓰는 것은 전형적 실패.
2. 지표를 늘릴 때는 "버릴 지표"를 명시한다. 새 지표를 넣을 때마다 기존의 무엇을 버릴 것인가를 반드시 논의한다. 버리지 않으면 대시보드가 부풀어 아무도 보지 않게 된다. Hayes (2008) 도 "지표는 추가보다 삭감이 조직에 미치는 효과가 크다"고 적었다.
3. NPS / CSAT / CES 의 질문 wording 을 고정한다. 3 지표 모두 wording 한 글자 차이로 스코어가 움직인다. 도입 시 wording 을 확정했다면 최소 2 년간은 바꾸지 않는다. 연도 간 비교를 가능하게 하는 것이 지표 운용의 최대 가치이다. wording 설계의 함정은 설문 wording 의 함정 에서 상세히 다룬다.
4. 표본 수의 최저 기준을 정한다. NPS 는 N=200 미만에서는 신뢰 구간이 ±10pt 이상 흔들린다. CSAT / CES 도 마찬가지. "N=50 에서 나온 NPS 가 전회 대비 +5 움직였다"는 오차 범위. 표본 수의 결정 방법 을 참조해 의사결정에 쓸 거라면 N=200 이상을 기준으로 삼는다.
5. "지표를 측정한다"에서 멈추지 말고 개선 PDCA 까지 설계한다. 각 지표에 "임계치 초과 시 알림 → 담당 부문에 분배 → 개선 액션 → 다음 측정에서 검증" 의 루프를 수치 설계 시점에 적어 둔다. 이를 안 하는 지표는 3 개월 후 대시보드의 장식이 된다.
7. 설문조사 도구 Kicue 로 3 지표를 운용하려면
Kicue 는 NPS·CSAT·CES 의 3 지표 모두를 1 파일 / 30 초로 생성할 수 있다.
NPS 의 구현
척도 설문 을 11 단계 (0~10) 로 설정. Markdown / Excel 템플릿에 "당신은 Kicue 를 친구나 동료에게 추천하시겠습니까? 0~10" 를 1 문항 적기만 하면 된다.
CSAT 의 구현
척도 설문 또는 SA (단일 선택) 을 5 단계 리커트로 설정. 질문문의 wording 은 리커트 척도 설계 에서 제시한 "기대와의 차이"를 명시하는 패턴을 추천한다.
CES 의 구현
척도 설문 을 7 단계 (1~7) 로 설정. Dixon et al. (2010) 원전의 wording "The company made it easy for me to handle my issue (이 회사는 내 문제에 대한 대응을 얼마나 쉽게 해 주었는가)" 가 업계 표준.
터치포인트별 배포
URL 파라미터 로 "어느 터치포인트에서 온 응답인지"를 식별. NPS (관계)와 CSAT (거래)와 CES (서포트)를 1 계정으로 운용하면서 대시보드에서는 별도 그래프로 나누는 것이 권장 운용이다.
집계와 이탈 전조 검출
원시 데이터 익스포트 로 NPS·CSAT·CES 의 스코어를 터치포인트별로 다운로드. 높은 CES (5 점 이상) 고객 리스트를 CRM 연동으로 플래그화하면 Dixon et al. (2010) 의 발견대로 이탈 전조 검출에 쓸 수 있다.
적합한 도구 선택 — 무료 플랜 한도, 분기 로직 지원, AI 기능, CSV 내보내기는 도구마다 크게 다릅니다. 무료 설문조사 도구 비교에서 이 접근법에 맞는 도구를 찾아보세요.
정리
CX 지표 선택 체크리스트:
- NPS / CSAT / CES 는 다른 구성 개념을 측정한다 — 충성도 / 만족 / 노력. 섞지 않는다.
- 3 개 모두 측정하면 실패한다 — "전부 한다"는 KPI 희석을 낳는다.
- 터치포인트 × 역할로 사용 구분한다 — 관계는 NPS, 거래는 CSAT, 마찰은 CES.
- 기업 단계에 따라 우선순위를 바꾼다 — 초기는 CSAT, 성장기는 NPS+CSAT, 성숙기는 3 층.
- 자주 발생하는 실수 3 가지: NPS 만으로 업적 예측 / 전 지표 병행에도 개선 없음 / 평균화 대시보드.
- 편집부 시각 5 가지: 터치포인트×역할로 적기 / 늘리려면 버리기 / wording 고정 / N=200 이상 / 개선 PDCA 까지 설계.
- Kicue 는 3 지표 모두를 1 파일 / 30 초로 생성 가능, URL 파라미터로 터치포인트 식별, 원시 데이터 익스포트로 이탈 전조 검출.
CX 지표는 "갖고 있는 숫자의 수"가 아니라 "개선에 쓰이는 숫자의 수"로 평가하는 것이 현대 CX 운용의 표준 자세이다. 본 글의 각 개별 글 (NPS / CSAT / CES)과 조합해, 먼저 "자사에서 의사결정에 쓰는 지표를 1~2 개로 좁힌다" 에서 시작해 주세요.
참고 문헌
학술·방법론
- Reichheld, F. F. (2003). The One Number You Need to Grow. Harvard Business Review, 81(12), 46–54.
- Dixon, M., Freeman, K., & Toman, N. (2010). Stop Trying to Delight Your Customers. Harvard Business Review, 88(7/8), 116–122.
- Keiningham, T. L., Cooil, B., Andreassen, T. W., & Aksoy, L. (2007). A Longitudinal Examination of Net Promoter and Firm Revenue Growth. Journal of Marketing, 71(3), 39–51.
- Oliver, R. L. (1980). A Cognitive Model of the Antecedents and Consequences of Satisfaction Decisions. Journal of Marketing Research, 17(4), 460–469.
- Hayes, B. E. (2008). Measuring Customer Satisfaction and Loyalty: Survey Design, Use, and Statistical Analysis Methods (3rd ed.). ASQ Quality Press.
- Morgeson, F. V., Hult, G. T. M., Mithas, S., Keiningham, T., & Fornell, C. (2020). Turning Complaining Customers into Loyal Customers. Journal of Marketing, 84(5), 79–99.
표준화 단체·방법론 센터
- ACSI (American Customer Satisfaction Index): Methodology.
- Qualtrics XM Institute: CX Measurement.
- Gartner: Customer Experience Measurement.
업계 가이드 (업계 관찰로 참조)
CX 지표 (NPS / CSAT / CES)를 30 초로 배포하고 싶다면, 무료 설문조사 도구 Kicue 를 사용해 보세요. 3 지표 모두를 척도 설문으로 구현할 수 있고, URL 파라미터로 터치포인트 식별, 원시 데이터 익스포트로 이탈 전조 검출까지 1 계정으로 운용할 수 있습니다.
