How-to

Excel로 설문조사 데이터 집계 — CSV에서 카이제곱 검정까지 5단계

설문조사 도구에서 CSV를 다운로드해 Excel로 집계하기까지의 실무 흐름을 5단계로 정리. UTF-8 글자 깨짐 대책, 피벗 테이블을 활용한 GT·교차 집계, CHISQ.TEST 함수에 의한 카이제곱 검정, 그래프화와 사내 공유까지, 30분 만에 리포트 1건을 완성하는 절차를 해설한다.

설문조사 도구에서 CSV를 다운로드해 Excel로 집계하여 리포트로 만든다 —— 리서치 운용에서 가장 빈번한 작업이지만, 피벗 테이블 필드 설정 실수, UTF-8 글자 깨짐, CHISQ.TEST 함수의 인수 오류 로 1~2시간을 낭비하는 현장을 자주 봅니다. 본고에서는 CSV를 Excel로 가져오는 절차부터, GT 집계·교차 집계·카이제곱 검정·그래프화까지를 30분 만에 완료하는 5단계 로 정리합니다.

각 Step에 "여기서 실패하는 사람이 많다"는 주의점과, 더 깊이 파고들기 위한 전문 기사 링크를 함께 기재합니다.

Step 1: CSV를 Excel로 가져오기 (UTF-8 글자 깨짐 대책)

CSV를 Excel에서 다루는 첫 번째 장벽은 한국어 글자 깨짐 입니다. CSV 파일을 더블 클릭으로 직접 열면 UTF-8 BOM 없는 파일에서는 "?"이나 깨진 글자로 표시됩니다. 반드시 "데이터 가져오기" 경유로 열어야 합니다.

절차:

  1. Excel을 시작 → "데이터" 탭 → "텍스트/CSV에서" 선택
  2. CSV 파일 선택
  3. 원본 파일: "65001 : Unicode (UTF-8)" 지정
  4. 구분 기호: "쉼표" 선택
  5. 데이터 형식 검색: "파일 전체" 권장
  6. "로드" 클릭

여기서 실패하는 사람이 많다: 더블 클릭으로 직접 열어 글자가 깨짐 → 재다운로드 → 다시 더블 클릭 의 무한 루프에 빠진다. 처음부터 "데이터 가져오기" 경유를 습관화하면 방지할 수 있습니다.

자세한 내용은 설문조사 데이터 클리닝 완전 가이드 에서, 가져온 후의 부정 응답 검출(Straightliner / Speeder)의 실무를 정리하고 있습니다.

Step 2: GT 집계를 피벗 테이블로 만들기

GT 집계(전체 집계)는 "각 설문의 선택지별 응답 수와 비율"을 산출하는 기본 작업입니다. 피벗 테이블로 한 번에 만들 수 있습니다.

절차:

  1. 데이터 범위 선택 → "삽입" → "피벗 테이블" → "확인"
  2. 집계하고 싶은 설문 열을 "행" 영역 으로 드래그
  3. 같은 설문 열을 "값" 영역 으로 드래그 (자동으로 건수 카운트)
  4. 값 필드 설정 → "계산 유형" → "열 합계에 대한 비율"로 % 표시
  5. "행 레이블"을 우클릭 → "정렬"로 건수 내림차순으로

여기서 실패하는 사람이 많다: 복수 응답(MA) 설문이 1개 열에 쉼표로 구분되어 들어 있는 경우, 피벗 집계가 작동하지 않는다. 사전에 "데이터" → "텍스트 나누기"로 여러 열로 전개한 후 집계하거나, Kicue 등의 도구 측에서 MA를 분할 열로 내보내는 설정을 확인합니다.

Step 3: 교차 집계(속성 × 설문) 만들기

교차 집계는 2개 설문의 관계성 을 보는 집계로, 리서치에서의 의사 결정에 가장 많이 사용됩니다. 예: "연령대별로 만족도가 어떻게 다른가".

절차:

  1. 새 피벗 테이블 작성 (같은 데이터 범위)
  2. "행": 속성 설문 (예: 연령대)
  3. "열": 평가 설문 (예: 만족도)
  4. "값": 건수 (임의의 열을 드래그하여 "개수" 선택)
  5. 값 필드 설정 → "계산 유형" → "행 합계에 대한 비율" 로 행 % 표시

이것으로 "연령대별 만족도 분포"가 %로 보입니다.

여기서 실패하는 사람이 많다: N이 작은 셀(N < 30)의 %를 보고 일희일비한다. "40대의 만족도가 80%"라고 해도 N=5라면 오차가 크고, 의사 결정의 근거가 되지 않는다. N과 %를 병기하는 습관 이 필수입니다.

자세한 내용은 설문조사 집계와 유의차 판정 — 교차 집계·카이제곱 검정·효과 크기 활용법 에서, 교차 집계에서 보아야 할 5가지 패턴을 정리하고 있습니다.

Step 4: 카이제곱 검정 (CHISQ.TEST 함수)

교차 집계에서 "차이가 있을 것 같다"고 생각되면, 통계적으로 유의한 차이인지 우연의 변동인지 를 카이제곱 검정으로 판정합니다. Excel의 CHISQ.TEST 함수로 실행할 수 있습니다.

절차:

  1. 교차 집계의 관측값 을 별도 시트에 복사 (행 / 열 소계 셀은 제외, 본체 셀만)
  2. 같은 크기의 기대값 매트릭스 작성. 각 셀은 =ROUND(행합계*열합계/총계, 2)
  3. CHISQ.TEST 함수 실행: =CHISQ.TEST(관측값 범위, 기대값 범위)
  4. 결과(p값) 산출
  5. p값이 0.05 미만이면 통계적으로 유의차 있음 으로 판단

예: =CHISQ.TEST(B2:D4, F2:H4) → 결과가 0.023이면 "연령대별 만족도 차이는 통계적으로 유의"

여기서 실패하는 사람이 많다: 기대값 계산을 잊고 관측값 범위를 2개 나열하는 오용. CHISQ.TEST는 "관측값 범위"와 "기대값 범위" 의 2개를 요구하는 함수입니다. 관측값만 전달하면 의미 없는 수치가 반환됩니다.

또한 p값만으로 판단하지 말 것. 표본 크기가 크면 작은 차이도 유의해지므로, 효과 크기(Cramér's V)와 함께 보는 것이 학술 표준입니다. 자세한 내용은 마찬가지로 설문조사 집계와 유의차 판정 가이드 에서, 효과 크기의 계산과 해석을 정리하고 있습니다.

Step 5: 그래프화와 사내 공유

집계 수치를 그대로 PPT / Word에 붙여 넣어도 전달되지 않습니다. 설문 유형별로 최적의 그래프 를 선택하여 리포트로 정형화합니다.

설문 유형별 최적 그래프:

  • 단일 응답(SA): 막대 그래프 (가로 막대 권장)
  • 복수 응답(MA): 막대 그래프
  • 리커트 척도: 발산형 누적 막대 그래프(divergent stacked bar)
  • 교차 집계: 그룹 막대 그래프 / 모자이크 플롯
  • 시계열: 꺾은선 그래프

정형의 최소 조건:

  • 축 레이블·범례·제목·데이터 소스를 반드시 첨부
  • 각 그래프에 N= 병기
  • 색상은 3색 이내로 압축 (배경색 포함)

여기서 실패하는 사람이 많다: 원형 그래프를 5세그먼트 이상으로 사용한다. 시각적으로 비교가 곤란해져, 독자의 인지 부하가 올라간다. 5세그먼트 초과는 막대 그래프가 표준입니다.

자세한 내용은 설문조사 결과 시각화 가이드 에서, 설문 유형별 최적 그래프와 피해야 할 5가지 위험 패턴을 정리하고 있습니다.

편집부의 시점 — Excel 집계를 효율화하는 3가지

업계 사례와 실무 담당자의 목소리를 지속적으로 추적하는 입장에서, Excel 집계를 효율화하는 3가지.

  1. 템플릿 시트를 만든다: GT 집계·교차 집계·카이제곱의 본보기를 Excel 템플릿화하고, 다음 프로젝트부터는 데이터만 교체 하는 운용으로 한다. 매번 처음부터 만들면 30분이 2시간으로 부풀어 오릅니다.
  2. 원본 데이터 시트는 절대 편집하지 않는다: 계산·그래프 작성은 별도 시트에서 실시하고, 원본 데이터는 백업용으로 보존. 실수로 원본 데이터를 덮어쓰면 복구 불가능한 사고가 빈발합니다.
  3. 집계 결과에 "N=" 을 반드시 병기: "만족 60%"보다 "만족 60%(N=120)"가 독자의 판단 자료가 됩니다. 표본 수가 작은 결과는 오해를 부르므로, N의 병기는 최소한의 리터러시입니다.

설문조사 도구 Kicue에서의 CSV 내보내기

Kicue의 CSV 내보내기는, 본 가이드의 Excel 집계 흐름에 태우기 쉬운 형식으로 출력됩니다:

  • UTF-8 문자 코드: Excel 가져오기에서 글자 깨짐이 발생하기 어려운 구조
  • 열 헤더에 설문 문장을 포함: 1행부터 사람이 읽을 수 있어, 설문 ID를 별도로 끌어올 필요가 없음
  • 응답자 ID 열: 교차 집계의 속성 결합이나, 추가 인터뷰 후보 추출(특정 세그먼트의 응답자 추출)에 활용 가능
  • 설문별 독립 열: 피벗 집계가 직접 가능한 구조

복수 응답(MA)의 출력 형식은 설문 설계 시의 설정에 의존하므로, 피벗 집계 전에 Step 2의 텍스트 나누기에 의한 열 분할 이 필요한 케이스가 있습니다. 본 기사의 절차로 대응 가능합니다.

다만, 카이제곱 검정이나 효과 크기 계산은 Excel 표준 기능 / R / Python / SPSS / JASP 로 실시하는 것이 현실적이며, Kicue 자체에는 통계 분석 기능은 제공하지 않습니다. CSV 내보내기 → 외부 도구 라는 워크플로우를 전제로 설계되어 있습니다.

정리 — 30분에 5단계

이것으로 30분에 리포트의 토대가 완성됩니다. 다음으로 밟아야 할 것은 템플릿화원본 데이터 보호 의 운용 설계입니다.


Excel에서 집계하기 쉬운 형식으로 CSV를 내보내고 싶으시다면, 무료 설문조사 도구 Kicue 를 사용해 보세요. Excel 가져오기에 친화적인 UTF-8 인코딩 CSV, 응답자 ID 컬럼을 포함한 구조화 데이터, 설문별 독립 컬럼 구성으로, 본 가이드의 Excel 집계 5단계를 1개 계정으로 시작할 수 있습니다(고급 통계 분석, 효과 크기 계산, Joint Display 작성은 R / Python / SPSS / JASP와의 조합 운영이 됩니다).

참고 문헌

관련 글

Kicue로 직접 설문을 만들어 보세요

조사표를 업로드하기만 하면 AI가 30초 만에 웹 설문을 자동 생성합니다.

무료로 시작하기