How-to

설문조사 샘플 수 결정 방법 — 신뢰도별 기준과 계산식

설문조사 필요 샘플 수는 신뢰도, 허용 오차, 모집단 크기로 결정된다. 신뢰도 95%, 오차 ±5%면 384명이 표준. 빠른 참조표, 계산식, 서브그룹 분석 시의 조정, 실무에서의 합의점을 5단계로 해설.

결론: 신뢰도 95%, 허용 오차 ±5%로 모집단이 충분히 크다면 필요 샘플 수는 384명. Cochran 공식에서 도출되는 업계 표준 출발점이다. 이유는 단순하다 — 모집단 크기가 1만을 넘으면 필요 샘플 수는 수학적으로 거의 일정 값에 수렴한다. 100만명이든 1억명이든 필요한 것은 대략 400명 전후.

다만 "384명만 모으면 OK"는 아니다. 서브그룹 분석의 유무, IR(출현율), 응답 품질에 따라 현실의 필요 수는 1.5~3배로 부풀어 오른다. 이 글에서는 5단계로 실무적인 샘플 수를 결정하는 절차를 해설한다.

1단계: 3가지 숫자로 목표를 결정 (2분)

샘플 수는 3가지 파라미터만으로 결정된다.

① 신뢰도(Confidence Level)

"같은 조사를 100번 반복하면 몇 번이 진짜 값의 범위에 들어가는가."

신뢰도용도Z 값
90%속보·참고값1.645
95% (표준)업계 표준1.96
99%의료·규제 연구2.576

고민되면 95%. 학술 논문, 시장 조사, 사내 의사결정 모두에서 표준이다.

② 허용 오차(Margin of Error)

"보고하는 % 의 전후로 몇 포인트까지 오차를 허용할 것인가."

허용 오차용도샘플 수 영향
±10%개략·예비 조사약 100명
±5% (표준)업계 표준약 384명
±3%엄밀한 수치가 필요약 1,067명
±1%정치 여론조사·국세조사급약 9,604명

허용 오차를 절반으로 하면 필요 샘플 수는 4배가 된다. ±5%에서 ±3%로 바꾸기만 해도 N이 거의 3배 가까이 늘어나는 이유가 여기 있다.

③ 모집단 크기(Population Size)

모집단필요 샘플 (신뢰도 95%, 오차 ±5%)
100명80명
500명217명
1,000명278명
5,000명357명
10,000명370명
100,000명 이상약 384명

모집단이 커질수록 필요 수는 수렴한다. "전국 소비자" "전 SNS 사용자" 같은 거대 모집단에서는 384라는 숫자만 기억해도 충분.

2단계: 계산식을 사용한다 (필요한 경우에만, 3분)

빠른 참조표로 충분한 경우가 대부분이지만, 공식을 알아두면 판단축이 늘어난다.

Cochran 공식 (무한 모집단)

n = (Z² × p × (1−p)) / e²
  • Z: 신뢰도의 Z 값(95%면 1.96)
  • p: 상정 비율(불명이면 0.5 = 최대값)
  • e: 허용 오차(±5%면 0.05)

신뢰도 95%, 오차 ±5%, 상정 비율 불명(0.5)으로 계산하면:

n = (1.96² × 0.5 × 0.5) / 0.05² = 3.8416 × 0.25 / 0.0025 = 384.16 → 385명

유한 모집단 보정

모집단이 10,000명 이하면 보정식으로 필요 수를 줄일 수 있다.

n_adj = n / (1 + (n − 1) / N)

예: 모집단 1,000명이라면 385 / (1 + (385−1)/1000) = 385 / 1.384 = 278명.

웹 계산 도구

직접 계산하고 싶지 않다면 SurveyMonkey의 계산 도구 등으로 즉시 산출 가능.

3단계: 서브그룹 분석을 고려해 N을 결정 (5분)

여기가 How와 전문 기사를 가르는 가장 중요한 포인트.

"전체로 384명"만 모아 만족하면, 성별×연령대별로 자른 순간 각 셀이 30~50명이 되어 서브그룹의 숫자는 신뢰할 수 없다는 사태가 된다.

서브그룹의 셀 설계

분석의 세분도필요 N (전체)
전체만(GT 집계만)384명
성별 2셀 × 연령대 4셀 = 8셀각 셀 50명 ×8 = 400~800명
성별 × 연령대 × 지역 3축(24셀)각 셀 30명 ×24 = 700~1,500명
성별 × 연령대 × 지역 × 이용 경험(48셀)1,500~3,000명

서브그룹 분석을 계획하고 있다면 각 셀 N=30 이상이 최저 라인. N=30을 밑돌면 서브그룹의 평균값·비율 해석은 실질적으로 의미가 없다.

자주 실패하는 케이스: "혹시 모르니 세밀하게 분석하고 싶다"

클라이언트로부터 "연령대별뿐 아니라 연령대×직업×지역으로도 분석할 수 있나요?" 라고 듣고 384명으로 승낙하는 것이 전형적인 실패. 승낙한다면 3축 크로스 분석이 성립하는 N=1,500~2,000을 견적하는 것이 현실적.

4단계: IR(출현율)과 응답률을 고려한 필요 발신 수 (3분)

실무에서는 "몇 명을 조사 대상으로 발신할 것인가"와 "몇 명에게서 응답이 돌아오는가"를 나눠 생각한다.

공식

필요 발신 수 = 필요 샘플 수 ÷ IR ÷ 완료율
  • IR(incidence rate): 발신 대상 중 조사 대상에 해당하는 비율
  • 완료율: 설문조사를 시작한 사람 중 끝까지 응답하는 비율

예: 30대 여성으로 "온라인 마트 이용자"를 384명 모은다

  • IR: 30대 여성 중 온라인 마트 이용자는 추정 40% → IR = 0.4
  • 완료율(업계 평균): 70% → 완료율 = 0.7
필요 발신 수 = 384 / 0.4 / 0.7 = 1,371명

스크리닝과 할당 관리가 전제라면 약 1,400명에게 스크리닝 발신이 필요하다는 견적. 자세한 내용은 스크리닝 문항의 설계와 운용을 참조.

IR을 모를 경우

과거 자사 데이터나 업계 리포트(Statista, 업계 단체 통계)를 사용. 그래도 잡히지 않으면 N=30~50의 파일럿 발신으로 IR을 실측한 후 본 발신에 들어가는 것이 안전. 자세한 내용은 파일럿 조사 운영 가이드를 참조.

5단계: 실무에서의 합의점 (3분)

이론값과 현실은 별개. 실무에서는 N=200~500의 폭에서 운영되는 것이 대부분.

업계 경험칙

시나리오권장 N
사내 설문조사(부서 단위)30~100
고객 만족도 조사(전체 경향만)200~400
고객 만족도 조사(속성별 분석 있음)500~1,000
브랜드 조사·시장 조사1,000~3,000
정책·대규모 통계 조사5,000+

"조금 여유있게"의 감각

  • 완료율을 낮게 견적(70%보다 60%로 계산)
  • 결손 데이터 제외 고려(클리닝 후 5~10%는 줄어드는 전제)
  • 서브그룹 분석 가능성 남기기(처음부터 최대 케이스로 설계)

이론값의 1.2~1.5배를 모으는 설계가 실무적인 버퍼.

가장 흔한 3가지 실수

1. "384명이면 충분"이라는 공식 지식만으로 끝낸다. 전체 경향만 본다면 384명으로 OK이지만 서브그룹 분석이 필요하면 별개. 승낙하기 전에 "크로스 분석의 축 수"를 확인하는 것이 철칙. "연령대×직업×지역"이라고 들으면 384명이 아니라 1,500명 이상을 견적해야 한다.

2. 완료율을 고려하지 않고 필요 수 = 발신 수로 계산한다. "384명 발신하면 384명이 응답해 준다"고 가정하는 것은 큰 실수. 완료율은 조사 채널별로 크게 다르다(패널 6080%, 메일 매거진 515%, SNS 1~5%). 발신 수 = 필요 샘플 ÷ IR ÷ 완료율로 역산하는 것이 정답.

3. 파일럿 발신을 생략한다. IR이 불명한 영역에서 본 발신을 돌리면 "상정 40%로 계산했더니 실 IR이 10%"라는 케이스에서 필요 발신 수가 4배로 뛰어오른다. N=30~50의 파일럿으로 IR을 실측하면 비용의 큰 사고를 막을 수 있다.

적합한 도구 선택 — 무료 플랜 한도, 분기 로직 지원, AI 기능, CSV 내보내기는 도구마다 크게 다릅니다. 무료 설문조사 도구 비교에서 이 접근법에 맞는 도구를 찾아보세요.

정리 — 5단계

단계할 일소요 시간
13가지 숫자(신뢰도·오차·모집단)로 목표 결정2분
2계산식 또는 빠른 참조표로 N 산출3분
3서브그룹 분석을 고려해 N 재계산5분
4IR과 완료율로 필요 발신 수 역산3분
5실무적인 버퍼 추가(×1.2~1.5)2분
합계15분

"설문조사 몇 명?"의 답은 전체 경향만이라면 384명, 속성별 분석이 있다면 500~1,500명이 현실적인 기준. 자세한 통계적 근거는 샘플 사이즈의 결정 방법(통계적 근거와 실무 기준)을 참조.


계산 후에 해야 할 것

샘플 수가 정해지면 집계와 유의차 판정 단계에서 다시 한 번 샘플 수의 타당성을 검증한다. "N이 부족해 유의차가 나오지 않는다" "N이 너무 커서 사소한 차이까지 유의가 된다" 양쪽 모두 실무에서 자주 있는 실패다. 자세한 내용은 집계와 유의차 판정 — 크로스 집계·카이제곱 검정·효과 크기 사용법을 참조.


조사표 파일을 업로드하기만 하면 AI가 웹 설문조사를 자동 생성하는 **무료 설문조사 도구 Kicue**를 시도해 보지 않겠습니까. 스크리닝 문항·할당 관리·회수 모니터링이 표준 탑재되어, 샘플 설계 그대로 운영에 태울 수 있습니다.

관련 글

Kicue로 직접 설문을 만들어 보세요

조사표를 업로드하기만 하면 AI가 30초 만에 웹 설문을 자동 생성합니다.

무료로 시작하기