"신상품 A는 4.2점, 신상품 B는 4.1점. A를 투입해야 한다"는 결론으로 회의가 끝났다. 실제로 팔린 것은 B 였다 — 마케팅 리서치 현장에서 누구나 한 번은 경험하는 오판단이다. 원인은 단순하다. 단문 평가(모나딕 평가)는 사람의 선호를 측정할 수 없다. "A도 B도 나쁘지 않다"라고 평가한 소비자가 매장에서 어느 쪽을 고르는지는 가격·패키지·기능의 트레이드오프로 결정된다.
이 트레이드오프를 통계적으로 측정하는 것이 컨조인트 분석(Conjoint Analysis). 이 글에서는 컨조인트 분석이 해결하는 문제, 주요 3 형식의 사용 구분, 속성·수준의 설계, 샘플 사이즈, 결과의 해석, 편집부의 함정, 그리고 설문조사 도구에서의 구현 방법을 정리한다. 마케팅 리서치의 핵심 기법이지만, 한국어로 실무를 향한 해설은 의외로 적은 영역이다.
1. 컨조인트 분석이 해결하는 문제
단문 평가로는 선호를 측정할 수 없는 이유
"상품 A를 어느 정도 사고 싶습니까?(5단계)" 같은 모나딕 평가는 평가 대상을 단독으로 봤을 때의 호감도를 측정한다. 문제는 현실의 구매는 단독 평가가 아니라 트레이드오프로 결정된다는 것.
예: 노트북 선택
- A: 고성능, 무거움, 고가격
- B: 중성능, 가벼움, 중가격
- C: 저성능, 가벼움, 저가격
단독 평가에서는 A가 최고점을 받을 확률이 높다(누구나 "고성능"은 좋아하니까). 그러나 "가격이 +50,000원이라면" "무게가 +500g이라면" 이라는 조건이 들어가면 선호는 극적으로 바뀐다.
컨조인트가 표준 기법인 이유
Green & Srinivasan (1990) Conjoint Analysis in Marketing은 컨조인트를 "복수 속성의 트레이드오프를 통계적으로 측정하는" 기법으로 체계화했다. 마케팅·경제학·공공정책에서 폭넓게 사용되며 실제 구매 행동과의 예측 정확도가 단문 평가보다 높다는 것이 반복적으로 실증되었다.
실무에서의 주요 용도:
- 신제품 컨셉 테스트: 어떤 속성 조합이 선택되는가
- 가격 전략: 가격 탄력성과 최적 가격대
- 패키지 최적화: 패키지 요소의 중요도
- 포지셔닝: 경쟁사와 비교한 상대적 매력도
2. 주요 3 형식의 사용 구분
컨조인트는 크게 3 형식이 있고, 목적과 샘플 규모에 따라 선택한다.
형식 1: 풀 프로파일법(Full-Profile Conjoint)
모든 속성을 포함한 카드(프로파일)를 제시하고 응답자가 랭킹 또는 평정하는 고전적 기법.
- 설계: 8~16장의 카드 × 전 속성
- 응답 부담: 중~고
- N: 100~300
- 강점: 직관적, 각 속성의 효용을 직접 추정
- 약점: 속성 수가 많으면 인지 부하로 정확도가 떨어진다(5~6 속성이 상한)
형식 2: 선택형 컨조인트(CBC = Choice-Based Conjoint)
복수의 선택지에서 "어떤 것을 고를 것인가"를 반복적으로 선택하게 하는, 현대의 주류 기법.
- 설계: 8
15 태스크 × 각 태스크에서 24 선택지에서 고름 - 응답 부담: 중
- N: 200
500(부분 효용값), 5001,000(HB 모델) - 강점: 실제 구매 시나리오에 가깝고 선택 셰어 예측 가능
- 약점: 설계와 분석이 복잡(직교 계획 + 계층 베이즈)
Louviere, Hensher, & Swait (2000) Stated Choice Methods에서 랜덤 효용 이론에 기반한 분석 체계가 확립되었다.
형식 3: MaxDiff(Maximum Difference Scaling)
"가장 중요한 것은 어느 것 / 가장 불필요한 것은 어느 것"을 고르게 하는, 중요도 측정에 특화된 기법.
- 설계: 각 태스크에서 4~5 항목에서 "최중요 / 최불필요"의 페어 선택
- 응답 부담: 낮음
- N: 200~500
- 강점: 순위 척도가 명확하고 항목 수가 많아도 다룰 수 있음(10~30 항목)
- 약점: 가격이나 수치 속성의 시뮬레이션에는 부적합
사용 구분 표
| 목적 | 권장 형식 | 전형 N |
|---|---|---|
| 가격 민감도·구매 의향 예측 | CBC | 500 |
| 다수 항목의 중요도 랭킹 | MaxDiff | 300 |
| 소수 속성에서의 효용 측정(4~5 속성) | 풀 프로파일 or CBC | 200 |
| 셰어 시뮬레이션 | CBC + HB | 500~1,000 |
실무에서는 CBC가 78할, MaxDiff가 23할, 풀 프로파일은 소수의 비율이다.
3. 속성과 수준의 설계
컨조인트의 품질은 설계로 결정된다. 속성과 수준의 설계에서 막히면 N을 아무리 모아도 결과는 사용할 수 없다.
속성 수의 기준
- CBC: 4~7 속성이 표준. 8 속성을 넘으면 인지 부하로 정확도가 떨어진다
- 풀 프로파일: 4~5 속성이 상한
- MaxDiff: "항목"을 10~30개까지 다룰 수 있다
수준 수의 기준
각 속성의 수준은 2~5 단계. 3~4가 가장 빈번.
예: 스마트워치 컨조인트
| 속성 | 수준 |
|---|---|
| 가격 | 199,000 / 299,000 / 499,000 / 799,000원 |
| 배터리 | 1일 / 3일 / 7일 |
| 헬스 기능 | 심박 / 심박+수면 / 심박+수면+스트레스 |
| 브랜드 | A사 / B사 / C사 / 자사 |
→ 4 × 3 × 3 × 4 = 144 가지 프로파일이 이론상 존재. 직교 계획법으로 12~16 태스크로 압축.
직교 계획법(Orthogonal Design)
속성 간의 상관을 최소화하도록 태스크를 통계적으로 짜는 기법. R의 AlgDesign 패키지나 Sawtooth Software가 표준 도구.
실무적으로: 속성과 수준을 결정하면 도구가 자동으로 태스크 세트를 생성한다. 직교성의 세부 이론은 몰라도 운용 가능하지만, 설계가 무너지지 않았는지 도구의 경고를 보는 습관은 필요.
속성 설계의 주의점
- 속성 간 독립성: "브랜드"와 "가격대"가 현실에서 상관되어 있는 경우, 컨조인트의 가정과 맞지 않는다
- 현실적인 범위: 가격 수준이 시장 가격을 크게 벗어나면 응답이 비현실적이 된다
- 속성 수의 스위트 스폿: 5
6 속성 × 34 수준이 인지 부하와 분석력의 균형이 좋다
4. 샘플 사이즈의 기준
컨조인트는 태스크 수 × N으로 정보량이 결정되므로, 단문보다 샘플이 적어도 되는 특징이 있다.
CBC 샘플 사이즈 기준
| 분석의 세분도 | 권장 N |
|---|---|
| 전체의 효용값(집계 레벨) | 200~300 |
| 세그먼트별 효용값(속성 × 연령대 등) | 각 셀 200 → 600~800 |
| 계층 베이즈(HB)로 개인별 효용값 | 500~1,000 |
| 셰어 시뮬레이션(시장 예측) | 500~1,500 |
Orme (2010) Getting Started with Conjoint Analysis나 Sawtooth Software의 업계 경험칙으로 N=300이 CBC의 현실적 최저 라인으로 여겨진다.
샘플 부족 시의 증상
- 부분 효용값의 표준 오차가 커서 속성 간 비교가 곤란
- HB 모델에서 수렴하지 않음
- 세그먼트별 셰어 시뮬레이션의 흔들림이 크다
샘플 설계의 자세한 내용은 샘플 수 결정 방법과 집계와 유의차 판정을 참조.
5. 결과의 해석 — 부분 효용값·상대 중요도·셰어 시뮬레이션
컨조인트의 분석 결과는 3가지 숫자로 실무에 번역된다.
부분 효용값(Part-worth Utilities)
각 속성 수준이 "선호에 얼마나 기여하는지"를 수치화한 것.
예(스마트워치):
| 속성 수준 | 부분 효용값 |
|---|---|
| 가격 199,000원 | +1.2 |
| 가격 299,000원 | +0.4 |
| 가격 499,000원 | −0.8 |
| 가격 799,000원 | −0.8 |
| 배터리 1일 | −0.5 |
| 배터리 3일 | +0.0 |
| 배터리 7일 | +0.5 |
이 값을 사용해서 임의의 프로파일의 선호 강도를 계산할 수 있다.
상대 중요도(Relative Importance)
각 속성이 선호에 미치는 영향의 비율. 속성마다 "최대 효용 − 최소 효용"을 계산하여 합계 100%로 정규화.
예:
- 가격: 35%
- 배터리: 25%
- 헬스 기능: 20%
- 브랜드: 20%
"가격이 최중요, 헬스 기능과 브랜드는 동등" 이라는 의사결정에 직접적 인풋이 된다.
셰어 시뮬레이션(Share of Preference)
복수의 경쟁 프로파일을 늘어놓았을 때 각 프로파일의 선택 셰어 예측.
예: 자사 신제품 X vs 경쟁 A vs 경쟁 B
- 자사 X(499,000원·5일 배터리): 셰어 42%
- 경쟁 A: 31%
- 경쟁 B: 27%
가격을 399,000원으로 낮추면 자사 X의 셰어는 55%로 올라간다 같은 가격-셰어 시뮬레이션이 실무에서 가장 중요시되는 출력.
계층 베이즈 모델(Hierarchical Bayes, HB)
집계 레벨이 아니라 개인마다 부분 효용값을 추정하는 기법. Train (2009) Discrete Choice Methods with Simulation에서 체계화된 방법론.
- 강점: 개인별 셰어 예측, 세그먼트 검출이 정밀
- 필요 N: 500~1,000
- 도구: Sawtooth Software CBC/HB, R의
bayesm패키지, Python의Choice-Models
6. 편집부의 시각 — 5가지 함정
업계 문헌과 현장 운영을 바탕으로 컨조인트 실시 시 편집부가 반드시 경계하는 5항목.
1. "일단 많은 속성을 넣는다"가 최대의 사고. 속성 수가 늘면 응답자의 인지 부하가 급상승해서 모든 태스크에서 "한가운데 선택지"를 고르는 satisficing이 발생한다. 4~6 속성이 CBC의 현실적 상한. "이것도 저것도"의 유혹에 이기는 것이 결과의 신뢰성을 지키는 최대의 열쇠. 설문의 인지 부하에 대해서는 설문 문항 작성의 함정도 같은 구조로 경고한다.
2. 가격 수준을 "시장 가격 ±α"로 설계하지 않으면 결과가 비현실적이 된다. 가격을 1,000원 / 1,000,000원처럼 극단적으로 흔들면 컨조인트는 "가격이 최중요"라는 당연한 결과만 낸다. **현실의 가격 폭 ±20~30%**로 좁히고 세그먼트별 가격 민감도를 보는 것이 실무적.
3. 속성 간 상관이 있는 경우는 주의. "브랜드"와 "가격대"가 현실에서 상관되어 있는 시장(고급 브랜드 = 고가격)에서 컨조인트를 직교 계획으로 짜면 **실재하지 않는 조합(고급 브랜드 × 저가격)**이 프로파일에 나와서 응답자를 혼란시킨다. 속성 간의 현실적인 제약은 설계 시에 제외하거나 HB로 사후 보정한다.
4. 셰어 시뮬레이션을 "절대값"으로 읽지 않는다. 셰어 시뮬레이션은 상대 비교에는 강하지만 절대값의 예측 정확도에는 한계가 있다. "컨조인트로 42% 셰어 → 실구매로 42% 팔린다"는 단순 해석은 금물. 실구매는 구매 빈도·배하율·광고 인지 등의 외부 요인도 얽히기 때문에 "현상에서 얼마나 셰어가 움직이는지"의 차분으로 보는 것이 정답.
5. MaxDiff를 "가격 민감도 측정"에 사용하지 않는다. MaxDiff는 항목의 중요도 랭킹에 최적이지만 가격이나 수치 속성의 효용 측정에는 부적합. "어떤 기능이 중요한가"는 MaxDiff, "얼마면 사겠나"는 CBC, 라고 명확하게 구분 사용. 둘을 혼동해서 MaxDiff로 가격을 측정하려고 하면 셰어 시뮬레이션이 무너진다.
7. 설문조사 도구 Kicue에서의 컨조인트 구현
솔직히 적는다. Kicue는 컨조인트 전용 도구가 아니다. 본격적인 컨조인트 분석에는 Sawtooth Software / Conjointly / Qualtrics CoreXM 등의 전용 플랫폼이 권장된다.
다만 간이적인 컨조인트 구현은 Kicue에서도 가능.
Kicue에서 가능한 간이 CBC
- SCREEN 문항을 사용해서 태스크마다 "2~4 선택지에서 고른다"를 구현
- 스킵 로직과 URL 파라미터로 태스크의 랜덤화를 제어
- 로데이터 익스포트로 R / Python에 넘겨
mlogit(R)이나xlogit(Python)으로 분석
Kicue에서 불가능 / 부적합한 부분
- 직교 계획의 자동 생성: 태스크 세트는 외부 도구(Sawtooth, R
support.CEs)에서 사전 생성하고 Kicue에 임포트 - 계층 베이즈(HB)의 자동 추정: 로데이터를 R / Python에 넘겨
bayesm등으로 실행 - 셰어 시뮬레이터: 대시보드에서의 시각화는 Kicue에서는 미제공. Tableau / Power BI에서 구현
용도별 권장 도구
| 용도 | 권장 도구 |
|---|---|
| 학술 연구·본격 마케팅 리서치 | Sawtooth Software CBC/HB |
| 비즈니스 과제 대상 중규모 조사 | Conjointly / Qualtrics CoreXM |
| 간이 조사·예산 제약 있음 | Kicue + R/Python에 의한 외부 처리 |
Kicue는 "간이 프로토타입으로서의 컨조인트 시행", "컨조인트 전단의 속성 스크리닝", "MaxDiff의 대체적인 중요도 랭킹" 같은 용도에서는 충분히 기능한다.
적합한 도구 선택 — 무료 플랜 한도, 분기 로직 지원, AI 기능, CSV 내보내기는 도구마다 크게 다릅니다. 무료 설문조사 도구 비교에서 이 접근법에 맞는 도구를 찾아보세요.
정리
컨조인트 분석의 실무 체크리스트:
- 단문 평가로는 선호를 측정할 수 없다 — 트레이드오프를 통계적으로 분석하는 것이 컨조인트의 본질
- 3 형식의 사용 구분: CBC(주류) / MaxDiff(중요도 랭킹) / 풀 프로파일(고전)
- 속성 수는 4
6, 수준은 25가 인지 부하와 분석력의 스위트 스폿 - CBC의 샘플 기준: 200
300(집계) / 5001,000(HB) / 500~1,500(셰어 예측) - 3가지 숫자로 읽는다: 부분 효용값 / 상대 중요도 / 셰어 시뮬레이션
- 5가지 함정: 속성 과다 / 비현실적 가격 / 속성 상관 / 절대값 해석 / MaxDiff 오용
- Kicue는 간이 구현 향, 본격 운영은 Sawtooth 등의 전용 도구가 권장
컨조인트 분석은 **"설계가 80%, 분석이 20%"**라고 하는 기법. 속성 수준 설계와 샘플 계획에 시간을 투자하면 N=300으로도 의사결정에 직결되는 숫자를 얻을 수 있다. 마케팅 리서치의 핵심 기법으로서 CX / EX / 제품 개발의 모든 영역에서 투자 가치가 높은 스킬이다.
참고 문헌
학술·방법론
- Green, P. E., & Srinivasan, V. (1990). 마케팅에서의 컨조인트 분석 — 연구와 실무에의 새로운 전개. Journal of Marketing, 54(4), 3–19.
- Louviere, J. J., Hensher, D. A., & Swait, J. D. (2000). Stated Choice Methods: Analysis and Applications. Cambridge University Press.
- Train, K. E. (2009). Discrete Choice Methods with Simulation (2nd ed.). Cambridge University Press.
- Orme, B. (2010). Getting Started with Conjoint Analysis: Strategies for Product Design and Pricing Research. Research Publishers LLC.
- Rao, V. R. (2014). Applied Conjoint Analysis. Springer.
표준화 단체·방법론 센터
- Sawtooth Software: Methodology Papers and Conferences.
- AAPOR (American Association for Public Opinion Research): Standard Definitions.
업계 가이드(업계 관찰로서 참조)
간이 컨조인트부터 설계해 보고 싶은 분은 **무료 설문조사 도구 Kicue**를 시도해 보지 않겠습니까. SCREEN 문항·스킵 로직·URL 파라미터·로데이터 익스포트가 표준 탑재되어 외부 도구(R / Python / Sawtooth)와의 접속도 매끄럽습니다.
