Conception des questions de filtrage — laisser passer uniquement les bons répondants

« On a recueilli N=500, mais à l'analyse il n'y avait quasiment personne de notre cible » — un désastre auto-infligé qui revient régulièrement. Huit fois sur dix, la cause profonde est un filtrage (SC) mal conçu. Et pourtant, le filtrage est traité comme un échauffement avant le questionnaire principal et reçoit rarement le temps qu'il mérite — un travers que les articles spécialisés relèvent à répétition.

Cet article explique comment les questions de filtrage devraient réellement être conçues : structure de base, modes d'échec typiques, processus de conception en cinq étapes, mathématiques du taux d'incidence (IR) et des quotas, règles d'opération qu'on ne peut pas sauter. Si vous prenez la recherche quantitative au sérieux, c'est la pièce de design qui décide en silence si vos données valent la peine d'être analysées.

1. Ce que sont les questions de filtrage

Les questions de filtrage (SC) sont le bloc de questions placé avant le questionnaire principal qui vérifie si le répondant fait partie de la cible. Les non qualifiés sont terminés immédiatement ; seuls les qualifiés passent au questionnaire principal (MQ).

À quoi sert le filtrage

Restreindre à la cible — confirme démographie, comportements, attitudes
Allouer aux quotas — gère les objectifs de complétion par cellule
Optimiser le coût — en panel, minimise les paiements aux non qualifiés
Protéger la qualité des données — empêche les réponses hors-cible de polluer l'analyse

Structure typique

[SC1] Genre : Homme / Femme / Autre
[SC2] Âge : saisie numérique (catégorisée automatiquement)
[SC3] Région
[SC4] Avez-vous acheté un produit de la catégorie X au cours des 3 derniers mois ? Oui / Non
[SC5] Fréquence d'achat : au moins mensuelle / moins / jamais

→ Quiconque répond « Non » à SC4 ou « jamais » à SC5 est terminé
→ Les qualifiés continuent vers [MQ Q1]

Sur le plan académique, Couper (2008) Designing Effective Web Surveys présente le filtrage comme le mécanisme qui minimise l'écart entre la « population visée » et l'« échantillon obtenu ». Quand le filtrage échoue, les hypothèses sous-jacentes à toute statistique en aval échouent avec lui.

2. Pourquoi le filtrage compte — ce qui se passe quand il échoue

Échec 1 : des hors-cible polluent les données

Vous voulez interroger « les personnes ayant fréquenté un café au cours des 6 derniers mois », vous relâchez le filtre, et vous récoltez des gens qui répondent au feeling. Avant toute analyse statistique, les réponses elles-mêmes ne sont plus fiables.

Les Standard Definitions de l'AAPOR placent la vérification d'éligibilité comme exigence fondamentale pour contrôler l'erreur d'échantillonnage et de couverture — et c'est le SC qui exécute cette vérification.

Échec 2 : les quotas explosent et il faut retourner sur le terrain

Vous fixez des quotas « 100 femmes 20 ans / 100 trentenaires / 100 quarantenaires », vous lancez, la cellule 20 ans se remplit immédiatement et la 40 ans ne se complète jamais. Refaire du terrain seulement sur les 40 ans cumule biais sur biais.

Échec 3 : se tromper sur l'IR pulvérise le budget

Vous ciblez « utilisateurs d'abonnement café » en supposant un IR de 10 %, vous découvrez que l'IR réel est 2 % — et le coût est multiplié par 5. Sans estimation d'IR en amont, les projets en panel partent régulièrement en désastre budgétaire.

La documentation méthodologique du Pew Research Center traite l'estimation d'IR et le design d'échantillon comme une seule étape de planification.

3. Processus de conception en cinq étapes

La pratique converge sur cinq étapes.

Étape 1 : définir population et cible précisément

Écrivez en une phrase qui vous voulez représenter : par ex. « femmes de 20–49 ans en France ayant acheté de la cosmétique en ligne au cours des 3 derniers mois ». Chaque question de filtrage se justifie face à cette phrase.

Étape 2 : énumérer les conditions à vérifier

Décomposez la cible en conditions vérifiables :

Démographiques — genre, âge, région, profession, revenu
Comportementales — achat, usage, fréquence, récence
Attitudinales — intérêt pour la catégorie, notoriété de marque

Étape 3 : ordonner les questions

Heuristique par défaut : large → précis, anodin → sensible, sans effort de mémoire → avec effort.

Position	Exemple	Pourquoi
Début	Genre, âge	Attributs larges sur tout l'échantillon
Milieu	Région, profession	Filtres intermédiaires
Plus tard	Usage, fréquence	Sensible ou nécessitant de la mémoire
Fin	Conditions détaillées	Vérifications finales sur les seuls qualifiés

Étape 4 : concevoir les quotas

Fixez les cibles par cellule et calculez les contacts nécessaires depuis l'IR. Notre guide sur comment déterminer la taille d'échantillon sert d'entrée pour le screener.

Étape 5 : pilote avant le lancement

Avant le terrain principal, lancez un petit pilote (N=30–100). Mesurez l'IR réel, le temps de réponse, les points d'abandon. Sauter le pilote garantit pratiquement un problème en terrain principal qui aurait pu être détecté en une journée.

4. Cinq règles pour concevoir le SC

Règle 1 : une condition par question (MECE)

Ne compressez pas plusieurs conditions en une seule question. « Êtes-vous une femme de 20 ans qui a acheté de la cosmétique au cours des 3 derniers mois ? » rend la logique de routage ingérable. Séparez chaque condition et combinez-les via la logique de saut.

Règle 2 : incluez toujours « aucune des propositions »

Mettez « aucune » ou « je n'en ai pas acheté » comme option explicite. Krosnick (1991) Response Strategies for Coping with the Cognitive Demands of Attitude Measures in Surveys montre que sans cette sortie, les répondants tendent vers le satisficing — ils cochent quelque chose de plausible pour avancer — et passent votre filtre.

Règle 3 : distinguez « actuellement » de « par le passé »

« Utilisez-vous le produit X ? » est ambigu entre usage actuel et passé. Utilisez des cadres temporels explicites : « actuellement utilisateur », « utilisé au cours des 3 derniers mois », « utilisé au cours des 12 derniers mois », « jamais utilisé ».

Règle 4 : items sensibles à la fin du SC

Revenu, santé, religion, opinions politiques — à la fin du screener, pas au début. Les mettre en tête fait exploser le taux d'abandon.

Règle 5 : ne laissez pas filtrer la « bonne réponse »

Ne préfacez jamais avec « cette étude concerne les utilisateurs du produit X ». Cela crée une incitation pour les non qualifiés à se déclarer qualifiés, et détruit la validité à la racine. Dans la profession, on parle de « blessure auto-infligée » — c'est ce niveau de basique.

5. Les maths : taux d'incidence et conception des quotas

Utilisez cette formule en conception pour que les quotas ne s'effondrent pas.

Contacts nécessaires

\text{Contacts nécessaires} = \frac{\text{Complets cibles}}{\text{IR} \times \text{Taux de complétion}}

Exemple : 500 complets cibles, IR 10 %, complétion 80 % → 500 / (0,10 × 0,80) = 6 250 contacts.

Gestion par cellule

Plan de quotas typique genre × tranche d'âge :

Cellule	Cible	IR estimé	Taux de complétion	Contacts nécessaires
Femmes, 20s	100	12 %	80 %	1 042
Femmes, 30s	100	10 %	80 %	1 250
Femmes, 40s	100	8 %	75 %	1 667
Femmes, 50s	100	5 %	70 %	2 857

Il est normal de faire varier IR et complétion selon la cellule — les benchmarks de Centiment et Pollfish observent à répétition que les cellules plus âgées ont IR et complétion plus bas.

6. Vue rédactionnelle — cinq règles qui font vraiment la différence

En suivant les rapports sectoriels et les cas publics, voici cinq points sur lesquels nous insisterions fortement.

1. Consacrez au SC autant de temps qu'au questionnaire principal. Le SC n'est pas un échauffement — c'est une discipline de design à part qui décide si le reste du projet est récupérable. Des équipes qui ont passé 30 minutes sur le SC et se sont fait surprendre en analyse, on en voit revenir dans la presse spécialisée. Allouez au moins une heure, idéalement deux. Ce n'est pas un investissement ; c'est un prérequis pour que les données soient exploitables.

2. Ne sous-estimez pas le biais d'auto-déclaration — il vous mange tout cru. Quand vous demandez « au cours des 3 derniers mois », la mémoire humaine tend à gonfler la fenêtre de récence de 1,5 à 2 fois — un résultat répété dans la recherche sur la réponse aux enquêtes (Tourangeau et al., 2000). Si votre screener dit « 3 derniers mois », concevez en supposant que vous demandez en fait « 6 derniers mois ».

3. Sauter le pilote vous coûtera une semaine. Un pilote de N=50 attrape 70 à 80 % des problèmes qui feraient autrement exploser le terrain principal. Pilote en un jour, correction en un autre, total deux jours. Sauter le pilote, c'est une à deux semaines à reprendre le terrain. Le ROI est si déséquilibré qu'il n'y a aucune défense pour le sauter.

4. Craignez davantage les « faux qualifiés » que les « faux non-qualifiés ». Un SC trop laxe laisse passer des hors-cible et corrompt les données. Un SC trop serré exclut quelques cibles et augmente le coût. Le premier mode d'échec est bien plus coûteux — les mauvaises décisions valent des ordres de grandeur de plus que le coût de recrutement. Dans le doute, filtrez plus serré, pas plus large.

5. N'ordonnez pas le SC uniquement pour la commodité des quotas. Demander genre et âge en haut est efficace pour le routage. Mais placer des items sensibles ou demandant de la mémoire en haut fait exploser l'abandon. Optimisez le taux total de complétion, pas l'efficacité de routage du screener lui-même. Ce trade-off apparaît dans presque tous les guides méthodologiques pour une raison.

7. Le filtrage dans l'Outil de Sondage Kicue

Kicue embarque tout ce qu'il faut pour un filtrage sérieux.

Type de question SCREEN

Le type SCREEN permet de marquer chaque option « qualifie » ou « termine » directement. Plus explicite que de bricoler de la logique de saut sur une SA générique, et plus simple à relire et à modifier ensuite.

Logique de saut et d'affichage

Quand la qualification dépend de combinaisons de SC, combinez logique de saut et logique d'affichage. Des conditions du type « continue uniquement si SC1 = A AND SC3 = B » s'expriment sans effort.

Quotas avec suivi en temps réel

Le module quotas suit les cibles par cellule contre les complets en direct. Quand une cellule (par ex. femmes 20s) atteint sa cible, le système peut auto-screen-out les qualifiés suivants dans cette cellule.

Paramètres d'URL pour le handoff de panel

Quand le trafic vient d'un panel externe, les paramètres d'URL reportent l'ID de panel, le genre, la tranche d'âge et tout autre attribut déjà vérifié — pas besoin de les redemander dans le SC.

Choisir le bon outil — Les limites du plan gratuit, le support du branchement, les capacités IA et l'export CSV varient beaucoup entre outils. Consultez notre comparatif des outils de sondage gratuits pour trouver le bon pour cette approche.

Résumé

Checklist pour concevoir et opérer les questions de filtrage :

Le SC n'est pas un échauffement, c'est un domaine de design à part. Il minimise l'écart entre population visée et échantillon obtenu.
Huit échecs sur dix naissent dans le SC — fuites hors-cible, quotas effondrés, IR mal estimé.
Cinq étapes : définir la population → énumérer les conditions → ordonner les questions → concevoir les quotas → pilote.
Cinq règles : une condition par question, toujours « aucune », distinguer actuel vs passé, items sensibles en fin, ne jamais laisser filtrer la bonne réponse.
Contacts nécessaires = complets cibles / (IR × complétion) — estimés par cellule.
Les équipes qui prennent le SC au sérieux gagnent en analyse. C'est la ligne de vie du projet.

Dans le suivi des rapports sectoriels, « les équipes qui rognent sur le SC rognent aussi en analyse ». Traiter le screener comme un objet de design indépendant est la bifurcation qui décide de la qualité de l'enquête.

Références

Académique et méthodologique

Couper, M. P. (2008). Designing Effective Web Surveys. Cambridge University Press.
Krosnick, J. A. (1991). Response Strategies for Coping with the Cognitive Demands of Attitude Measures in Surveys. Applied Cognitive Psychology.
Tourangeau, R., Rips, L. J. et Rasinski, K. (2000). The Psychology of Survey Response. Cambridge University Press.

Organismes de référence et centres méthodologiques

Benchmarks de prestataires (traités comme observations sectorielles)

Envie de concevoir et d'exécuter des enquêtes filtrées de bout en bout ? Essayez l'outil de sondage en ligne gratuit Kicue. Le type de question SCREEN, la logique de saut et la gestion des quotas en temps réel sont livrés en standard, donc votre design de filtrage rejoint directement l'analyse.