Comment calculer la taille d'échantillon d'une enquête — niveaux de confiance, formules et la règle des 384

Le verdict : à 95 % de confiance et ±5 % de marge d'erreur, il faut 384 répondants quand la population est suffisamment grande. C'est la base de l'industrie issue de la formule de Cochran. La raison est simple : dès que la population dépasse environ 10 000, la taille d'échantillon requise converge mathématiquement vers une valeur quasi constante. Que votre population soit de 1 million ou de 100 millions, il vous faut environ 400 répondants.

Mais « 384 et c'est plié » n'est pas tout à fait juste. L'analyse par sous-groupes, l'IR (taux d'incidence) et la qualité des réponses peuvent chacun pousser le besoin pratique à 1,5–3× plus. Cet article parcourt comment décider la bonne taille d'échantillon en cinq étapes.

Étape 1 : décider l'objectif avec trois nombres (2 min)

La taille d'échantillon est déterminée par trois paramètres :

① Niveau de confiance

« Si vous lanciez la même enquête 100 fois, combien de fois le résultat tomberait-il dans la vraie plage ? »

Confiance	Cas d'usage	Valeur Z
90 %	Lecture rapide, exploration	1,645
95 % (standard)	Standard de l'industrie	1,96
99 %	Médical / réglementaire	2,576

95 % est le défaut pour les articles académiques, la recherche marketing et les décisions opérationnelles.

② Marge d'erreur

« Combien de points de pourcentage d'erreur êtes-vous prêt à accepter autour de votre % rapporté ? »

Marge	Cas d'usage	N requis
±10 %	Approximatif ou pilote	~100
±5 % (standard)	Standard de l'industrie	~384
±3 %	Recherche haute précision	~1 067
±1 %	Sondage national, qualité census	~9 604

Diviser la marge d'erreur par deux quadruple la taille requise. C'est pourquoi passer de ±5 % à ±3 % pousse N de 384 à 1 067.

③ Taille de la population

Population	N requis (95 %, ±5 %)
100	80
500	217
1 000	278
5 000	357
10 000	370
100 000+	~384

Le N requis converge quand la population grandit. Pour des enquêtes auprès de « tous les consommateurs » ou « tous les utilisateurs SNS », retenez juste 384 et vous êtes paré.

Étape 2 : utilisez la formule (seulement si nécessaire, 3 min)

Pour la plupart des cas, le tableau ci-dessus suffit, mais connaître la formule élargit votre jugement.

Formule de Cochran (population infinie)

n = (Z² × p × (1−p)) / e²

Z : valeur Z pour la confiance (1,96 à 95 %)
p : proportion attendue (utilisez 0,5 si inconnu — c'est le maximum)
e : marge d'erreur (0,05 à ±5 %)

Pour 95 % de confiance, ±5 % d'erreur, p=0,5 :

n = (1,96² × 0,5 × 0,5) / 0,05² = 3,8416 × 0,25 / 0,0025 = 384,16 → 385

Correction pour population finie

Si votre population est ≤10 000, vous pouvez réduire le besoin :

n_adj = n / (1 + (n − 1) / N)

Exemple : population = 1 000 → 385 / (1 + (385−1)/1000) = 385 / 1,384 = 278.

Calculatrices en ligne

Pas envie de calculer ? La calculatrice de SurveyMonkey et autres font ça en quelques secondes.

Étape 3 : ajustez pour l'analyse par sous-groupes (5 min)

C'est ici que les How et les spécialisés divergent — et c'est l'étape la plus oubliée.

Si vous collectez 384 pour la vue générale puis découpez par genre × tranche d'âge, chaque cellule a 30–50 répondants. Les chiffres par sous-groupe ne sont plus fiables à cette profondeur.

Dimensionnement des cellules pour sous-groupes

Profondeur d'analyse	N total requis
Global seulement (GT seul)	384
Genre × âge (8 cellules)	50 × 8 = 400–800
Genre × âge × région (24 cellules)	30 × 24 = 700–1 500
Croisés à 4 dimensions (48 cellules)	1 500–3 000

Pour l'analyse par sous-groupe, N≥30 par cellule est le plancher. En dessous, moyennes et pourcentages par sous-groupe deviennent essentiellement non interprétables.

Échec courant : « on l'analysera plus en profondeur tant qu'on y est »

Un client demande « peut-on aussi regarder âge × occupation × région ? » — et vous acceptez avec seulement 384 collectés. Résultat : chaque cellule a 5 répondants, les croisés sont du bruit. Si vous acceptez, dimensionnez à N=1 500–2 000 pour une vraie analyse 3 voies.

Étape 4 : intégrez IR et taux de réponse (3 min)

Sur le terrain, « combien à inviter » et « combien répondront » sont deux nombres différents.

Formule

Invitations requises = N requis ÷ IR ÷ Taux de complétion

IR (taux d'incidence) : parmi les invités, la part qui qualifie réellement
Taux de complétion : parmi ceux qui ont commencé, la part qui a fini

Exemple : 384 femmes trentenaires utilisant la livraison de courses

IR : parmi les trentenaires, ~40 % utilisent la livraison → IR = 0,4
Taux de complétion (typique) : 70 % → 0,7

Invitations requises = 384 / 0,4 / 0,7 = 1 371

Donc il faut distribuer le screening à ~1 400 personnes pour atterrir sur 384 complets qualifiés. Voir le guide de conception et opération des questions de filtrage pour la mécanique complète.

Quand l'IR est inconnu

Utilisez les données internes antérieures ou les rapports d'industrie (Statista, associations professionnelles). Si rien n'existe, lancez un pilote N=30–50 pour mesurer l'IR avant de vous engager sur le terrain principal. Voir le guide de tests pilotes.

Étape 5 : le point d'équilibre pratique (3 min)

Les N théoriques et de terrain diffèrent. En pratique, la plupart des projets atterrissent entre N=200 et N=500.

Règles de terrain

Scénario	N recommandé
Enquête équipe interne	30–100
Satisfaction client (tendance globale)	200–400
Satisfaction client (avec analyse par sous-groupe)	500–1 000
Recherche de marque / marché	1 000–3 000
Politique publique / stats à grande échelle	5 000+

Ajoutez un « coussin confortable »

Estimez le taux de complétion bas (utilisez 60 % plutôt que 70 %)
Tenez compte des pertes au nettoyage (5–10 % seront exclus après cleaning)
Laissez de la place pour des analyses sous-groupe imprévues (concevez pour le plus grand cas)

→ Prévoyez de collecter 1,2–1,5× le minimum théorique comme tampon pratique.

Trois pièges courants

1. S'arrêter à « 384 suffit ». Pour les tendances globales, 384 marche. Pour l'analyse par sous-groupes, non. Avant d'accepter le plan d'échantillonnage, confirmez les axes de croisement que l'équipe prévoit. « Âge × occupation × région » demande 1 500+, pas 384.

2. Confondre N requis et invitations requises. Supposer « invite 384, reçois 384 réponses » est l'erreur la plus courante. Les taux de complétion varient beaucoup selon le canal (panel : 60–80 %, listes mail : 5–15 %, social : 1–5 %). Calculez toujours à l'envers : invitations = N ÷ IR ÷ taux de complétion.

3. Sauter le pilote quand l'IR est inconnu. Aller au terrain principal avec « je vais supposer 40 % d'IR » — pour découvrir que l'IR réel est 10 % — quadruple les coûts d'invitation. Un pilote de 30–50 pour mesurer l'IR prévient ce genre de désastre de coût.

Choisir le bon outil — Les limites du plan gratuit, le support du branchement, les capacités IA et l'export CSV varient beaucoup entre outils. Consultez notre comparatif des outils de sondage gratuits pour trouver le bon pour cette approche.

Résumé — 5 étapes

Étape	Tâche	Temps
1	Décider l'objectif avec trois nombres (confiance, erreur, population)	2 min
2	Utiliser formule ou tableau	3 min
3	Ajuster pour sous-groupes	5 min
4	Calculer invitations à partir d'IR et taux de complétion	3 min
5	Ajouter un tampon pratique (×1,2–1,5)	2 min
Total	—	15 min

La réponse à « combien de répondants me faut-il ? » est 384 pour les tendances globales, 500–1 500 pour l'analyse par sous-groupes dans la plupart des cas pratiques. Pour les fondements statistiques complets, voir le guide de conception de taille d'échantillon.

Après avoir dimensionné l'échantillon

Une fois N fixé, revisitez-le pendant l'agrégation et le test de significativité. À la fois « N trop petit pour détecter une vraie différence » et « N si grand que des différences triviales deviennent statistiquement significatives » sont des pièges de terrain courants. Voir agrégation et test de significativité.

Essayez Kicue — un outil de sondage en ligne gratuit : téléversez le fichier du questionnaire et l'IA génère le formulaire web automatiquement. Filtrage, gestion des quotas et monitoring de réponses en direct livrés en standard, donc le design d'échantillon passe proprement à l'opérationnel.