설문의 샘플 사이즈는 어떻게 정하는가 — 통계적 근거와 실무 기준

"설문, 몇 명부터 받으면 의미가 있나요?"——리서치에 관련된 사람이라면, 한 번쯤 들어본 적도, 물어본 적도 있는 질문일 것입니다. 답은 **"통계적으로는 정해진 공식이 있지만, 실무에서는 그것만으로는 정해지지 않는다"**는 다소 명쾌하지 않은 것이 됩니다. "일단 100명", "예산으로 정해 버렸다"로 달린 결과, 보고 단계에서 "샘플 수가 부족하다"고 지적받는——이런 소소한 사고도 현장에서 자주 봅니다.

이 글에서는 설문 조사의 샘플 사이즈를 정하기 위한 **통계적인 근거(Cochran의 공식·신뢰도·허용 오차)**와 업계에서 사용되고 있는 실무 기준, 그리고 소규모 샘플로 달릴 때의 함정을 정리합니다. 통계 교과서와 업계 벤더의 가이드라인을 양쪽 모두 참조하면서, "자신 있게 N을 정할 수 있는" 상태를 목표로 합니다.

1. 샘플 사이즈가 좌우하는 3가지

우선, 샘플 사이즈가 무엇을 좌우하는지를 정리해 두겠습니다.

신뢰도(confidence level): 같은 조사를 100회 반복했을 때, 몇 회 "같은 범위에 결과가 들어오는가". 95%가 업계 표준
오차(margin of error): 샘플 결과와 모집단의 "진짜 값"과의 편차의 허용 폭. 통상 ±5%가 표준
모집단으로부터의 샘플 대표성: 모집단 전체의 경향을, 샘플이 얼마나 충실하게 반영하고 있는가

샘플 사이즈를 늘리면, 신뢰도가 오르고, 오차가 작아지고, 대표성이 높아집니다. 다만, 늘릴수록 비용도 비례하기 때문에, "어디까지 늘리면 의미가 있는가"를 정할 필요가 있습니다. 여기서부터는 통계적인 이야기가 됩니다.

2. 통계적인 결정 방법 — Cochran의 공식

샘플 사이즈 결정에 관한 고전적인 공식이, William G. Cochran이 1977년에 제창한 Cochran's Formula입니다. 지금도 많은 교과서·실무 가이드라인에서 참조되고 있는, 샘플 사이즈 계산의 표준이라고 할 수 있는 방법론입니다.

Cochran의 공식

무한 모집단을 상정한 기본형:

n_0 = \frac{Z^2 \cdot p(1 - p)}{e^2}

각 파라미터의 의미:

$n_0$ : 필요한 샘플 사이즈
$Z$ : 신뢰도에 대응하는 Z값(신뢰도 95%라면 $Z = 1.96$ , 99%라면 $Z = 2.58$ )
$p$ : 모집단에서의 "특정 응답을 선택할 비율"의 상정값. 불명이라면 $p = 0.5$ (가장 샘플 수가 많아지는 보수적인 값)
$e$ : 허용 오차(통상 $e = 0.05$ = ±5%)

신뢰도 95%( $Z = 1.96$ ), $p = 0.5$ , $e = 0.05$ 로 계산하면:

n_0 = \frac{1.96^2 \times 0.5 \times 0.5}{0.05^2} = 384.16

즉, 무한 모집단에 대해서는, 약 384 샘플로 신뢰도 95%·오차 ±5%의 추정이 가능하다는 것이 됩니다.

유한 모집단의 보정

모집단이 유한한 경우(예: 자사의 고객 1,000명), 유한 모집단 보정(Finite Population Correction, FPC)을 적용합니다.

n = \frac{n_0}{1 + \dfrac{n_0 - 1}{N}}

$N$ 은 모집단 사이즈. 이에 따라, 모집단이 작은 경우에는 필요 샘플 수도 비례하여 작게 해도 됩니다.

공식으로부터 도출되는 대표적인 기준

신뢰도 95%, 오차 ±5%, p = 0.5로 계산한 결과:

모집단 사이즈(N)	필요 샘플 수(n)
100	80
500	217
1,000	278
10,000	370
100,000 이상 / 무한	384

자세한 공식 해설은, Cochran's Sample Size Formula의 통계 해설이나, 응용 조사 연구에서의 샘플 사이즈 결정에 관한 논고 등에서 확인할 수 있습니다.

3. 업계에서 사용되고 있는 실무 기준

Cochran의 공식은 통계적인 최솟값을 제시하지만, 실무에서는 통계 이외의 요소도 얽히기 때문에, 벤더 각 사가 기준을 공개하고 있습니다. 다만 학술적인 엄밀성이라기보다, 현장에서 널리 공유되고 있는 참고값으로 다루는 것이 적절합니다.

오차 레인지별 샘플 기준

국내 리서치 회사의 해설을 종합하면, 오차 폭마다 다음과 같은 기준이 널리 유통되고 있습니다(매크로밀 외 각 사의 칼럼 참조).

샘플 수	표본 오차의 기준	실무에서의 위치
50	약 ±15%	대략적인 경향 파악(개관 레벨)
100	약 ±10%	비교적 신뢰성이 있는 결과
400	약 ±5%	정밀도 높은 조사 결과(업계 표준)
1,000	약 ±3%	고정밀도, 세밀한 차이도 검출 가능

"조사라고 하면 N=400이 표준"이라는 감각이 업계에 있는 것은, 오차 ±5%를 달성하는 최저선이 대략 384 샘플 전후라는 통계적 사실에서 유래합니다.

비용과 정밀도의 밸런스 — 왜 "400 부근이 가장 가성비가 좋은가"

이 관계를 그래프로 보면, 샘플 사이즈와 오차의 관계가 "극적으로 줄어드는 전반"과 "거의 정체인 후반"으로 명확하게 갈린다는 것을 한눈에 알 수 있습니다.

信頼度 95% (Z=1.96)、p=0.5 での計算

100 → 400에서는 오차가 약 9.8% → 4.9%로 반감하지만, 400 → 1,000에서는 4.9% → 3.1%로 1.8포인트밖에 줄지 않는다. 샘플 수를 2.5배로 해도, 정밀도 향상은 한정적입니다. 이것은 $e = 1.96 \sqrt{p(1-p)/n}$ 이라는 관계식 속의 $\sqrt{n}$ 에서 유래하는 구조적인 특성으로, 샘플 수를 4배로 하지 않으면 오차가 반감하지 않는다는 사실을 반영하고 있습니다.

업계 표준이 N=400인 것은, 이 곡선에서 "정밀도의 개선 폭이 급격히 감속하기 시작하는 지점"에 해당하기 때문입니다. 비용과 정밀도의 밸런스를 고려한 경우, 400 부근이 가장 비용 대비 효과가 높은 레인지가 됩니다.

벤더 공개의 샘플 사이즈 계산 도구

온라인에서 사용할 수 있는 계산 도구도 복수 공개되어 있습니다. 입력 항목(모집단·신뢰도·오차)은 각 사 공통:

어느 것이든 Cochran의 공식을 베이스로 하고 있으므로, 결과는 거의 같습니다. 계산 그 자체는 도구에 맡겨도 좋은 영역이지만, 입력하는 전제(신뢰도 몇 %? 오차 몇 %?)의 선택은 사람의 판단입니다.

4. 용도별 샘플 사이즈 실무 기준

조사의 종류에 따라, 필요한 정밀도는 달라집니다. 업계 기사를 종합하면, 다음과 같은 구분 사용이 일반적입니다.

스크리닝·탐색 조사

목적: 가설 검증 전의 "대략 전체 감"을 파악한다
기준: 30~100 샘플
판단 기준: 오차 ±10~15%라도 의사 결정에 영향을 주지 않는 장면

본 조사(의사 결정에 직결되는 조사)

목적: 제품·서비스의 설계나 경영 판단의 근거로 한다
기준: 300~500 샘플(전체)
판단 기준: 오차 ±5%, 신뢰도 95%의 업계 표준

세그먼트별 비교 조사

목적: 성·연대·직업·지역 등의 세그먼트 간에서 비교
기준: 각 세그먼트 100 샘플 이상(전체로는 800~2,000으로 부풀어 오른다)
판단 기준: 세그먼트 내의 오차도 ±10% 이내에 억제한다

정점 관측·트렌드 분석

목적: 같은 조사를 경시적으로 반복하여, 변화를 쫓는다
기준: 각 회 400~1,000 샘플
판단 기준: 차이(전회 vs 금회)가 통계적으로 유의해지는 규모를 확보

"용도를 모호한 채 샘플 수만 정하는" 것이 최대의 안티 패턴입니다. 용도가 먼저, 샘플 수는 나중.

5. 샘플 사이즈가 작을 때의 리스크

"예산의 사정으로 N=50밖에 얻을 수 없다"는 장면도 있습니다. 이때 무엇이 일어나는지를 이해해 두면, 리스크를 인식한 후에 의사 결정을 할 수 있습니다.

리스크 1: 신뢰 구간이 넓어진다

N=50이라면 오차 ±15% 정도가 됩니다. "구매 의향이 40%"라는 결과는, 실제로는 "25~55%의 범위"를 의미합니다. "구매 의향이 높다"고 단언하기에는 범위가 너무 넓은 케이스가 많습니다.

리스크 2: 세그먼트 분석을 할 수 없다

전체 50 샘플 중, 남성 25 / 여성 25, 더 나아가 연대를 나누면 각 셀 5~10 샘플. 이 사이즈로는 세그먼트 비교는 통계적으로 거의 무의미합니다.

리스크 3: 극단 응답자의 영향이 증대

1명의 극단적인 응답이 전체 스코어를 크게 움직입니다. 특히 자유 기술의 카테고리 분류에서는, 소수파의 의견이 "다수파의 의견"으로 보이는 착각이 일어나기 쉽습니다.

작은 샘플이라도 사용할 수 있는 장면

정성적인 통찰 추출: "어떤 불만이 있는가"의 열거에는 N=30이라도 충분
사전 가설의 타당성 체크: 본 조사 전의 파일럿
기존 데이터의 보완: 대규모 데이터가 있고, 추가로 소수 심층 분석하고 싶은 장면

"작은 샘플로 숫자를 혼자 걷게 하지 않는" 것이 현장의 철칙입니다.

6. 편집부의 시점 — 샘플 사이즈 설계의 함정 4가지

업계 기사와 공개 사례를 추적해 온 입장에서, 샘플 사이즈로 "반드시 사고가 나는" 4가지 패턴을 열거합니다. 여기는 강하게 씁니다.

1. "일단 100명"으로 달리는 것은, 상상 이상으로 리스크가 크다. N=100의 표본 오차는 ±10%. "구매 의향 40%"가 "30~50%의 범위"를 의미한다는 것을, 의사 결정자가 이해하지 못하고 있으면 숫자가 혼자 걸어가게 됩니다. 100으로 달린다면, 보고에서 "이 결과의 오차 범위는 ±10%입니다"라고 반드시 명기한다. 이것을 하지 않는 보고서는, 나중에 "근거가 약하다"고 지적받는 단골 패턴입니다.

2. 전체 샘플 수만 정하고, 세그먼트의 N을 무시한다. "전체 500 받습니다"라고 말해 놓고 뚜껑을 열어 보니, 중요 세그먼트가 각 30 샘플——이것, 정말 자주 있습니다. 세그먼트 분석을 전제로 하는 조사에서는, 최소 셀 규모로부터 역산한다. 40~59세 여성의 Top 2 Box를 비교하고 싶다면, 각 셀 100 이상을 먼저 정한다. 전체의 볼륨은 결과로서 정해집니다.

3. 응답률을 고려하지 않고, 필요 샘플 수를 "배포 수"와 혼동한다. 필요 샘플 수 384라고 했을 때, 배포를 384로 설정하는 사람이 가끔 있는데, 절대로 안 됩니다. 메일 배포로 응답률이 10%라면, 384 × 10 = 3,840건 배포가 필요해집니다. 응답률을 반드시 예상한 후에, 배포 수를 역산한다. 응답률을 올리는 실천 포인트도 참조해 주세요.

4. "샘플 수가 많으면 정확하다"는 오해. 샘플 사이즈는 정밀도에 영향을 주지만, 편향된 샘플은 많아도 정확해지지 않는다. 10,000명을 모아도, "자사의 헤비 유저에게서만 응답이 온" 것이라면, 그것은 편향된 데이터입니다. 샘플 사이즈 이전에, 모집단을 대표하는 샘플이 모아지고 있는지 쪽이 중요. 편향된 대규모 조사보다, 대표성이 있는 소규모 조사 쪽이 의사 결정에는 사용할 수 있습니다.

7. 설문조사 도구 Kicue에서의 조사 설계

Kicue에서는 샘플 사이즈 계산에 도움이 되는 기능을 기본 탑재하고 있습니다.

할당(쿼터) 관리 — 세그먼트별 목표 샘플 수를 설정하고, 달성하면 자동 마감(상세)
실시간 회수 모니터링 — 세그먼트별 진척을 대시보드에서 확인(상세)
URL 파라미터 연계 — 외부 패널로부터 유도 시에 속성 정보를 받고, 배포 타겟을 제어
응답률 향상 기능 — 모바일 최적화·분기 로직·진척 바로, 배포 수에 대한 회수율을 최대화

설문지 파일을 업로드하는 것만으로, 목적의 샘플 수를 효율적으로 달성할 수 있는 설계를 자동화할 수 있습니다.

적합한 도구 선택 — 무료 플랜 한도, 분기 로직 지원, AI 기능, CSV 내보내기는 도구마다 크게 다릅니다. 무료 설문조사 도구 비교에서 이 접근법에 맞는 도구를 찾아보세요.

정리

설문 조사의 샘플 사이즈 결정의 체크포인트:

통계적인 기준은 Cochran의 공식 — 신뢰도 95%·오차 ±5%로 약 384 샘플이 무한 모집단의 기준
유한 모집단 보정으로 줄일 수 있다 — N=100의 모집단이라면 80 샘플, N=1,000이라면 278 샘플
용도에 따라 기준은 달라진다 — 스크리닝은 30~~100, 본 조사는 300~~500, 세그먼트 비교는 각 셀 100 이상
작은 샘플은 오차 ±15%를 받아들일 각오로 — 숫자의 혼자 걷기를 피하기 위해, 오차 범위를 명기한다
샘플 수보다 대표성 — 편향된 샘플은 많아도 정확해지지 않는다, 모집단을 대표할 수 있는지가 본질

"몇 명 받으면 의미가 있는가"의 답은, 조사 목적과 정밀도 요건에서 역산한다. 이것을 습관화할 수 있으면, 예산이나 기간의 제약 속에서도 납득감 있는 조사 설계를 할 수 있게 됩니다.

참고 문헌

학술·통계 이론

Determination of Sample Size and Sampling Methods in Applied Research (2021). ResearchGate.
Sample Size in Statistics: Cochran's Formula & General Tips. Statistics How To.
Cochran's Sample Size Calculator Guide. SPSS Services.

업계 벤더의 샘플 사이즈 가이드(업계 설명으로 참조)

국내 리서치 회사의 샘플 수 해설(업계 설명으로 참조)

조사 설계부터 샘플 관리까지 원스톱으로 효율화할 수 있는 무료 설문조사 도구 Kicue 를 사용해 보세요. 할당 설정과 실시간 모니터링이 기본입니다.