Le verdict : à 95 % de confiance et ±5 % de marge d'erreur, il faut 384 répondants quand la population est suffisamment grande. C'est la base de l'industrie issue de la formule de Cochran. La raison est simple : dès que la population dépasse environ 10 000, la taille d'échantillon requise converge mathématiquement vers une valeur quasi constante. Que votre population soit de 1 million ou de 100 millions, il vous faut environ 400 répondants.
Mais « 384 et c'est plié » n'est pas tout à fait juste. L'analyse par sous-groupes, l'IR (taux d'incidence) et la qualité des réponses peuvent chacun pousser le besoin pratique à 1,5–3× plus. Cet article parcourt comment décider la bonne taille d'échantillon en cinq étapes.
Étape 1 : décider l'objectif avec trois nombres (2 min)
La taille d'échantillon est déterminée par trois paramètres :
① Niveau de confiance
« Si vous lanciez la même enquête 100 fois, combien de fois le résultat tomberait-il dans la vraie plage ? »
| Confiance | Cas d'usage | Valeur Z |
|---|---|---|
| 90 % | Lecture rapide, exploration | 1,645 |
| 95 % (standard) | Standard de l'industrie | 1,96 |
| 99 % | Médical / réglementaire | 2,576 |
95 % est le défaut pour les articles académiques, la recherche marketing et les décisions opérationnelles.
② Marge d'erreur
« Combien de points de pourcentage d'erreur êtes-vous prêt à accepter autour de votre % rapporté ? »
| Marge | Cas d'usage | N requis |
|---|---|---|
| ±10 % | Approximatif ou pilote | ~100 |
| ±5 % (standard) | Standard de l'industrie | ~384 |
| ±3 % | Recherche haute précision | ~1 067 |
| ±1 % | Sondage national, qualité census | ~9 604 |
Diviser la marge d'erreur par deux quadruple la taille requise. C'est pourquoi passer de ±5 % à ±3 % pousse N de 384 à 1 067.
③ Taille de la population
| Population | N requis (95 %, ±5 %) |
|---|---|
| 100 | 80 |
| 500 | 217 |
| 1 000 | 278 |
| 5 000 | 357 |
| 10 000 | 370 |
| 100 000+ | ~384 |
Le N requis converge quand la population grandit. Pour des enquêtes auprès de « tous les consommateurs » ou « tous les utilisateurs SNS », retenez juste 384 et vous êtes paré.
Étape 2 : utilisez la formule (seulement si nécessaire, 3 min)
Pour la plupart des cas, le tableau ci-dessus suffit, mais connaître la formule élargit votre jugement.
Formule de Cochran (population infinie)
n = (Z² × p × (1−p)) / e²
- Z : valeur Z pour la confiance (1,96 à 95 %)
- p : proportion attendue (utilisez 0,5 si inconnu — c'est le maximum)
- e : marge d'erreur (0,05 à ±5 %)
Pour 95 % de confiance, ±5 % d'erreur, p=0,5 :
n = (1,96² × 0,5 × 0,5) / 0,05² = 3,8416 × 0,25 / 0,0025 = 384,16 → 385
Correction pour population finie
Si votre population est ≤10 000, vous pouvez réduire le besoin :
n_adj = n / (1 + (n − 1) / N)
Exemple : population = 1 000 → 385 / (1 + (385−1)/1000) = 385 / 1,384 = 278.
Calculatrices en ligne
Pas envie de calculer ? La calculatrice de SurveyMonkey et autres font ça en quelques secondes.
Étape 3 : ajustez pour l'analyse par sous-groupes (5 min)
C'est ici que les How et les spécialisés divergent — et c'est l'étape la plus oubliée.
Si vous collectez 384 pour la vue générale puis découpez par genre × tranche d'âge, chaque cellule a 30–50 répondants. Les chiffres par sous-groupe ne sont plus fiables à cette profondeur.
Dimensionnement des cellules pour sous-groupes
| Profondeur d'analyse | N total requis |
|---|---|
| Global seulement (GT seul) | 384 |
| Genre × âge (8 cellules) | 50 × 8 = 400–800 |
| Genre × âge × région (24 cellules) | 30 × 24 = 700–1 500 |
| Croisés à 4 dimensions (48 cellules) | 1 500–3 000 |
Pour l'analyse par sous-groupe, N≥30 par cellule est le plancher. En dessous, moyennes et pourcentages par sous-groupe deviennent essentiellement non interprétables.
Échec courant : « on l'analysera plus en profondeur tant qu'on y est »
Un client demande « peut-on aussi regarder âge × occupation × région ? » — et vous acceptez avec seulement 384 collectés. Résultat : chaque cellule a 5 répondants, les croisés sont du bruit. Si vous acceptez, dimensionnez à N=1 500–2 000 pour une vraie analyse 3 voies.
Étape 4 : intégrez IR et taux de réponse (3 min)
Sur le terrain, « combien à inviter » et « combien répondront » sont deux nombres différents.
Formule
Invitations requises = N requis ÷ IR ÷ Taux de complétion
- IR (taux d'incidence) : parmi les invités, la part qui qualifie réellement
- Taux de complétion : parmi ceux qui ont commencé, la part qui a fini
Exemple : 384 femmes trentenaires utilisant la livraison de courses
- IR : parmi les trentenaires, ~40 % utilisent la livraison → IR = 0,4
- Taux de complétion (typique) : 70 % → 0,7
Invitations requises = 384 / 0,4 / 0,7 = 1 371
Donc il faut distribuer le screening à ~1 400 personnes pour atterrir sur 384 complets qualifiés. Voir le guide de conception et opération des questions de filtrage pour la mécanique complète.
Quand l'IR est inconnu
Utilisez les données internes antérieures ou les rapports d'industrie (Statista, associations professionnelles). Si rien n'existe, lancez un pilote N=30–50 pour mesurer l'IR avant de vous engager sur le terrain principal. Voir le guide de tests pilotes.
Étape 5 : le point d'équilibre pratique (3 min)
Les N théoriques et de terrain diffèrent. En pratique, la plupart des projets atterrissent entre N=200 et N=500.
Règles de terrain
| Scénario | N recommandé |
|---|---|
| Enquête équipe interne | 30–100 |
| Satisfaction client (tendance globale) | 200–400 |
| Satisfaction client (avec analyse par sous-groupe) | 500–1 000 |
| Recherche de marque / marché | 1 000–3 000 |
| Politique publique / stats à grande échelle | 5 000+ |
Ajoutez un « coussin confortable »
- Estimez le taux de complétion bas (utilisez 60 % plutôt que 70 %)
- Tenez compte des pertes au nettoyage (5–10 % seront exclus après cleaning)
- Laissez de la place pour des analyses sous-groupe imprévues (concevez pour le plus grand cas)
→ Prévoyez de collecter 1,2–1,5× le minimum théorique comme tampon pratique.
Trois pièges courants
1. S'arrêter à « 384 suffit ». Pour les tendances globales, 384 marche. Pour l'analyse par sous-groupes, non. Avant d'accepter le plan d'échantillonnage, confirmez les axes de croisement que l'équipe prévoit. « Âge × occupation × région » demande 1 500+, pas 384.
2. Confondre N requis et invitations requises. Supposer « invite 384, reçois 384 réponses » est l'erreur la plus courante. Les taux de complétion varient beaucoup selon le canal (panel : 60–80 %, listes mail : 5–15 %, social : 1–5 %). Calculez toujours à l'envers : invitations = N ÷ IR ÷ taux de complétion.
3. Sauter le pilote quand l'IR est inconnu. Aller au terrain principal avec « je vais supposer 40 % d'IR » — pour découvrir que l'IR réel est 10 % — quadruple les coûts d'invitation. Un pilote de 30–50 pour mesurer l'IR prévient ce genre de désastre de coût.
Choisir le bon outil — Les limites du plan gratuit, le support du branchement, les capacités IA et l'export CSV varient beaucoup entre outils. Consultez notre comparatif des outils de sondage gratuits pour trouver le bon pour cette approche.
Résumé — 5 étapes
| Étape | Tâche | Temps |
|---|---|---|
| 1 | Décider l'objectif avec trois nombres (confiance, erreur, population) | 2 min |
| 2 | Utiliser formule ou tableau | 3 min |
| 3 | Ajuster pour sous-groupes | 5 min |
| 4 | Calculer invitations à partir d'IR et taux de complétion | 3 min |
| 5 | Ajouter un tampon pratique (×1,2–1,5) | 2 min |
| Total | — | 15 min |
La réponse à « combien de répondants me faut-il ? » est 384 pour les tendances globales, 500–1 500 pour l'analyse par sous-groupes dans la plupart des cas pratiques. Pour les fondements statistiques complets, voir le guide de conception de taille d'échantillon.
Après avoir dimensionné l'échantillon
Une fois N fixé, revisitez-le pendant l'agrégation et le test de significativité. À la fois « N trop petit pour détecter une vraie différence » et « N si grand que des différences triviales deviennent statistiquement significatives » sont des pièges de terrain courants. Voir agrégation et test de significativité.
Essayez Kicue — un outil de sondage en ligne gratuit : téléversez le fichier du questionnaire et l'IA génère le formulaire web automatiquement. Filtrage, gestion des quotas et monitoring de réponses en direct livrés en standard, donc le design d'échantillon passe proprement à l'opérationnel.
