Excel로 설문조사 데이터 집계 — CSV에서 카이제곱 검정까지 5단계

설문조사 도구에서 CSV를 다운로드해 Excel로 집계하여 리포트로 만든다 —— 리서치 운용에서 가장 빈번한 작업이지만, 피벗 테이블 필드 설정 실수, UTF-8 글자 깨짐, CHISQ.TEST 함수의 인수 오류 로 1~2시간을 낭비하는 현장을 자주 봅니다. 본고에서는 CSV를 Excel로 가져오는 절차부터, GT 집계·교차 집계·카이제곱 검정·그래프화까지를 30분 만에 완료하는 5단계 로 정리합니다.

각 Step에 "여기서 실패하는 사람이 많다"는 주의점과, 더 깊이 파고들기 위한 전문 기사 링크를 함께 기재합니다.

Step 1: CSV를 Excel로 가져오기 (UTF-8 글자 깨짐 대책)

CSV를 Excel에서 다루는 첫 번째 장벽은 한국어 글자 깨짐 입니다. CSV 파일을 더블 클릭으로 직접 열면 UTF-8 BOM 없는 파일에서는 "?"이나 깨진 글자로 표시됩니다. 반드시 "데이터 가져오기" 경유로 열어야 합니다.

절차:

Excel을 시작 → "데이터" 탭 → "텍스트/CSV에서" 선택
CSV 파일 선택
원본 파일: "65001 : Unicode (UTF-8)" 지정
구분 기호: "쉼표" 선택
데이터 형식 검색: "파일 전체" 권장
"로드" 클릭

여기서 실패하는 사람이 많다: 더블 클릭으로 직접 열어 글자가 깨짐 → 재다운로드 → 다시 더블 클릭 의 무한 루프에 빠진다. 처음부터 "데이터 가져오기" 경유를 습관화하면 방지할 수 있습니다.

자세한 내용은 설문조사 데이터 클리닝 완전 가이드 에서, 가져온 후의 부정 응답 검출(Straightliner / Speeder)의 실무를 정리하고 있습니다.

Step 2: GT 집계를 피벗 테이블로 만들기

GT 집계(전체 집계)는 "각 설문의 선택지별 응답 수와 비율"을 산출하는 기본 작업입니다. 피벗 테이블로 한 번에 만들 수 있습니다.

절차:

데이터 범위 선택 → "삽입" → "피벗 테이블" → "확인"
집계하고 싶은 설문 열을 "행" 영역 으로 드래그
같은 설문 열을 "값" 영역 으로 드래그 (자동으로 건수 카운트)
값 필드 설정 → "계산 유형" → "열 합계에 대한 비율"로 % 표시
"행 레이블"을 우클릭 → "정렬"로 건수 내림차순으로

여기서 실패하는 사람이 많다: 복수 응답(MA) 설문이 1개 열에 쉼표로 구분되어 들어 있는 경우, 피벗 집계가 작동하지 않는다. 사전에 "데이터" → "텍스트 나누기"로 여러 열로 전개한 후 집계하거나, Kicue 등의 도구 측에서 MA를 분할 열로 내보내는 설정을 확인합니다.

Step 3: 교차 집계(속성 × 설문) 만들기

교차 집계는 2개 설문의 관계성 을 보는 집계로, 리서치에서의 의사 결정에 가장 많이 사용됩니다. 예: "연령대별로 만족도가 어떻게 다른가".

절차:

새 피벗 테이블 작성 (같은 데이터 범위)
"행": 속성 설문 (예: 연령대)
"열": 평가 설문 (예: 만족도)
"값": 건수 (임의의 열을 드래그하여 "개수" 선택)
값 필드 설정 → "계산 유형" → "행 합계에 대한 비율" 로 행 % 표시

이것으로 "연령대별 만족도 분포"가 %로 보입니다.

여기서 실패하는 사람이 많다: N이 작은 셀(N < 30)의 %를 보고 일희일비한다. "40대의 만족도가 80%"라고 해도 N=5라면 오차가 크고, 의사 결정의 근거가 되지 않는다. N과 %를 병기하는 습관 이 필수입니다.

자세한 내용은 설문조사 집계와 유의차 판정 — 교차 집계·카이제곱 검정·효과 크기 활용법 에서, 교차 집계에서 보아야 할 5가지 패턴을 정리하고 있습니다.

Step 4: 카이제곱 검정 (CHISQ.TEST 함수)

교차 집계에서 "차이가 있을 것 같다"고 생각되면, 통계적으로 유의한 차이인지 우연의 변동인지 를 카이제곱 검정으로 판정합니다. Excel의 CHISQ.TEST 함수로 실행할 수 있습니다.

절차:

교차 집계의 관측값 을 별도 시트에 복사 (행 / 열 소계 셀은 제외, 본체 셀만)
같은 크기의 기대값 매트릭스 작성. 각 셀은 =ROUND(행합계*열합계/총계, 2)
CHISQ.TEST 함수 실행: =CHISQ.TEST(관측값 범위, 기대값 범위)
결과(p값) 산출
p값이 0.05 미만이면 통계적으로 유의차 있음 으로 판단

예: =CHISQ.TEST(B2:D4, F2:H4) → 결과가 0.023이면 "연령대별 만족도 차이는 통계적으로 유의"

여기서 실패하는 사람이 많다: 기대값 계산을 잊고 관측값 범위를 2개 나열하는 오용. CHISQ.TEST는 "관측값 범위"와 "기대값 범위" 의 2개를 요구하는 함수입니다. 관측값만 전달하면 의미 없는 수치가 반환됩니다.

또한 p값만으로 판단하지 말 것. 표본 크기가 크면 작은 차이도 유의해지므로, 효과 크기(Cramér's V)와 함께 보는 것이 학술 표준입니다. 자세한 내용은 마찬가지로 설문조사 집계와 유의차 판정 가이드 에서, 효과 크기의 계산과 해석을 정리하고 있습니다.

Step 5: 그래프화와 사내 공유

집계 수치를 그대로 PPT / Word에 붙여 넣어도 전달되지 않습니다. 설문 유형별로 최적의 그래프 를 선택하여 리포트로 정형화합니다.

설문 유형별 최적 그래프:

단일 응답(SA): 막대 그래프 (가로 막대 권장)
복수 응답(MA): 막대 그래프
리커트 척도: 발산형 누적 막대 그래프(divergent stacked bar)
교차 집계: 그룹 막대 그래프 / 모자이크 플롯
시계열: 꺾은선 그래프

정형의 최소 조건:

축 레이블·범례·제목·데이터 소스를 반드시 첨부
각 그래프에 N= 병기
색상은 3색 이내로 압축 (배경색 포함)

여기서 실패하는 사람이 많다: 원형 그래프를 5세그먼트 이상으로 사용한다. 시각적으로 비교가 곤란해져, 독자의 인지 부하가 올라간다. 5세그먼트 초과는 막대 그래프가 표준입니다.

자세한 내용은 설문조사 결과 시각화 가이드 에서, 설문 유형별 최적 그래프와 피해야 할 5가지 위험 패턴을 정리하고 있습니다.

편집부의 시점 — Excel 집계를 효율화하는 3가지

업계 사례와 실무 담당자의 목소리를 지속적으로 추적하는 입장에서, Excel 집계를 효율화하는 3가지.

템플릿 시트를 만든다: GT 집계·교차 집계·카이제곱의 본보기를 Excel 템플릿화하고, 다음 프로젝트부터는 데이터만 교체 하는 운용으로 한다. 매번 처음부터 만들면 30분이 2시간으로 부풀어 오릅니다.
원본 데이터 시트는 절대 편집하지 않는다: 계산·그래프 작성은 별도 시트에서 실시하고, 원본 데이터는 백업용으로 보존. 실수로 원본 데이터를 덮어쓰면 복구 불가능한 사고가 빈발합니다.
집계 결과에 "N=" 을 반드시 병기: "만족 60%"보다 "만족 60%(N=120)"가 독자의 판단 자료가 됩니다. 표본 수가 작은 결과는 오해를 부르므로, N의 병기는 최소한의 리터러시입니다.

설문조사 도구 Kicue에서의 CSV 내보내기

Kicue의 CSV 내보내기는, 본 가이드의 Excel 집계 흐름에 태우기 쉬운 형식으로 출력됩니다:

UTF-8 문자 코드: Excel 가져오기에서 글자 깨짐이 발생하기 어려운 구조
열 헤더에 설문 문장을 포함: 1행부터 사람이 읽을 수 있어, 설문 ID를 별도로 끌어올 필요가 없음
응답자 ID 열: 교차 집계의 속성 결합이나, 추가 인터뷰 후보 추출(특정 세그먼트의 응답자 추출)에 활용 가능
설문별 독립 열: 피벗 집계가 직접 가능한 구조

복수 응답(MA)의 출력 형식은 설문 설계 시의 설정에 의존하므로, 피벗 집계 전에 Step 2의 텍스트 나누기에 의한 열 분할 이 필요한 케이스가 있습니다. 본 기사의 절차로 대응 가능합니다.

다만, 카이제곱 검정이나 효과 크기 계산은 Excel 표준 기능 / R / Python / SPSS / JASP 로 실시하는 것이 현실적이며, Kicue 자체에는 통계 분석 기능은 제공하지 않습니다. CSV 내보내기 → 외부 도구 라는 워크플로우를 전제로 설계되어 있습니다.

정리 — 30분에 5단계

Step 1 CSV 가져오기: UTF-8 지정으로 더블 클릭을 피한다 → 데이터 클리닝 가이드
Step 2 GT 집계: 피벗 테이블로 단번에, MA는 사전 분할 → 집계와 유의차 판정 가이드
Step 3 교차 집계: 행 %로 표시, N과 %를 병기 → 집계와 유의차 판정 가이드
Step 4 카이제곱 검정: 관측값 + 기대값의 2 범위를 CHISQ.TEST에 전달 → 집계와 유의차 판정 가이드
Step 5 그래프화: 설문 유형별로 최적 그래프, 5세그먼트 초과는 막대 그래프 → 시각화 가이드

이것으로 30분에 리포트의 토대가 완성됩니다. 다음으로 밟아야 할 것은 템플릿화 와 원본 데이터 보호 의 운용 설계입니다.

Excel에서 집계하기 쉬운 형식으로 CSV를 내보내고 싶으시다면, 무료 설문조사 도구 Kicue 를 사용해 보세요. Excel 가져오기에 친화적인 UTF-8 인코딩 CSV, 응답자 ID 컬럼을 포함한 구조화 데이터, 설문별 독립 컬럼 구성으로, 본 가이드의 Excel 집계 5단계를 1개 계정으로 시작할 수 있습니다(고급 통계 분석, 효과 크기 계산, Joint Display 작성은 R / Python / SPSS / JASP와의 조합 운영이 됩니다).

참고 문헌

Field, A. (2017). Discovering Statistics Using IBM SPSS Statistics (5th ed.). SAGE Publications.