Fazit: Bei 95 % Konfidenz und ±5 % Fehlerspanne braucht ihr 384 Befragte, sobald die Population groß genug ist. Das ist die Industriebasis aus Cochrans Formel. Der Grund ist einfach: sobald die Population etwa 10 000 überschreitet, konvergiert die benötigte Stichprobengröße mathematisch gegen einen nahezu konstanten Wert. Egal ob 1 Million oder 100 Millionen — ihr braucht etwa 400 Befragte.
Aber „384 und fertig" stimmt nicht ganz. Untergruppenanalyse, IR (Inzidenzrate) und Antwortqualität können den praktischen Bedarf jeweils auf das 1,5–3-Fache hochtreiben. Dieser Beitrag erklärt in fünf Schritten, wie ihr die richtige Stichprobengröße bestimmt.
Schritt 1: Ziel mit drei Zahlen festlegen (2 min)
Die Stichprobengröße wird durch drei Parameter bestimmt:
① Konfidenzniveau
„Wenn ihr dieselbe Umfrage 100-mal laufen ließet, wie oft sollte das Ergebnis im wahren Bereich liegen?"
| Konfidenz | Anwendung | Z-Wert |
|---|---|---|
| 90 % | Schnelle Lesungen, Exploration | 1,645 |
| 95 % (Standard) | Industriestandard | 1,96 |
| 99 % | Medizin / regulatorisch | 2,576 |
95 % ist der Default für akademische Papers, Marktforschung und operative Entscheidungen.
② Fehlerspanne (Margin of Error)
„Wie viele Prozentpunkte Fehler akzeptiert ihr um euer berichtetes % herum?"
| Fehlerspanne | Anwendung | Benötigtes N |
|---|---|---|
| ±10 % | Grob oder Pilot | ~100 |
| ±5 % (Standard) | Industriestandard | ~384 |
| ±3 % | Hochpräzise Forschung | ~1.067 |
| ±1 % | Nationale Wahlumfragen, Census-Niveau | ~9.604 |
Die Fehlerspanne zu halbieren vervierfacht die benötigte Stichprobengröße. Deshalb springt N von 384 auf 1.067, wenn ihr von ±5 % auf ±3 % wechselt.
③ Populationsgröße
| Population | Benötigtes N (95 %, ±5 %) |
|---|---|
| 100 | 80 |
| 500 | 217 |
| 1.000 | 278 |
| 5.000 | 357 |
| 10.000 | 370 |
| 100.000+ | ~384 |
Das benötigte N konvergiert, wenn die Population wächst. Für Umfragen unter „allen Konsumenten" oder „allen SNS-Nutzern" reicht es, sich nur die 384 zu merken.
Schritt 2: Formel benutzen (nur wenn nötig, 3 min)
Für die meisten Fälle reicht die Tabelle oben, aber die Formel zu kennen erweitert das Urteilsvermögen.
Cochrans Formel (unendliche Population)
n = (Z² × p × (1−p)) / e²
- Z: Z-Wert für Konfidenz (1,96 bei 95 %)
- p: erwarteter Anteil (0,5 verwenden, wenn unbekannt — das Maximum)
- e: Fehlerspanne (0,05 bei ±5 %)
Für 95 % Konfidenz, ±5 % Fehler, p=0,5:
n = (1,96² × 0,5 × 0,5) / 0,05² = 3,8416 × 0,25 / 0,0025 = 384,16 → 385
Korrektur für endliche Population
Bei Population ≤10.000 könnt ihr den Bedarf reduzieren:
n_adj = n / (1 + (n − 1) / N)
Beispiel: Population = 1.000 → 385 / (1 + (385−1)/1000) = 385 / 1,384 = 278.
Online-Rechner
Keine Lust auf Mathe? SurveyMonkeys Rechner und andere erledigen das in Sekunden.
Schritt 3: Anpassung für Untergruppenanalyse (5 min)
Hier divergieren How und Spezialartikel — und das ist der am häufigsten übersehene Schritt.
Wenn ihr 384 für das Gesamtbild sammelt und dann nach Geschlecht × Altersgruppe trennt, hat jede Zelle 30–50 Befragte. Untergruppenzahlen sind nicht mehr zuverlässig auf dieser Tiefe.
Zellgrößen für Untergruppen
| Analysetiefe | Benötigtes Gesamt-N |
|---|---|
| Nur Gesamt (einzelne GT) | 384 |
| Geschlecht × Alter (8 Zellen) | 50 × 8 = 400–800 |
| Geschlecht × Alter × Region (24 Zellen) | 30 × 24 = 700–1.500 |
| Vier-Wege-Kreuze (48 Zellen) | 1.500–3.000 |
Für Untergruppenanalyse ist N≥30 pro Zelle die Untergrenze. Darunter werden Untergruppen-Mittelwerte und -Prozente im Wesentlichen uninterpretierbar.
Häufiger Fehler: „wir analysieren das ja sowieso noch tiefer"
Ein Kunde fragt „können wir auch Alter × Beruf × Region anschauen?" — und ihr akzeptiert mit nur 384 erhobenen. Ergebnis: jede Zelle hat 5 Befragte, die Kreuztabellen sind Rauschen. Wenn ihr akzeptiert, plant N=1.500–2.000 für eine echte 3-Wege-Untergruppenanalyse.
Schritt 4: IR und Antwortquote einbeziehen (3 min)
Im Feld sind „wie viele einladen" und „wie viele werden antworten" zwei verschiedene Zahlen.
Formel
Erforderliche Einladungen = Benötigtes N ÷ IR ÷ Abschlussrate
- IR (Inzidenzrate): Anteil der Eingeladenen, der für die Umfrage qualifiziert
- Abschlussrate: Anteil derjenigen, die begonnen haben, der fertig wird
Beispiel: 384 Frauen in den 30ern, die Lebensmittelzustellung nutzen
- IR: unter 30er-Frauen nutzen ~40 % Lebensmittelzustellung → IR = 0,4
- Abschlussrate (typisch): 70 % → 0,7
Erforderliche Einladungen = 384 / 0,4 / 0,7 = 1.371
Also müsst ihr das Screening an ~1.400 Personen verteilen, um 384 qualifizierte Abschlüsse zu landen. Die volle Mechanik im Leitfaden zu Screening-Fragen-Design und Betrieb.
Wenn IR unbekannt ist
Nutzt vorherige interne Daten oder Branchenberichte (Statista, Branchenverbände). Wenn nichts vorliegt, lasst einen Pilot mit N=30–50 laufen, um die IR vor dem Hauptlauf zu messen. Siehe Leitfaden für Pilotstudien.
Schritt 5: Der praktische Sweetspot (3 min)
Theoretisches und Feld-N unterscheiden sich. In der Praxis landen die meisten Projekte zwischen N=200 und N=500.
Praxisfaustregeln
| Szenario | Empfohlenes N |
|---|---|
| Interne Team-Umfrage | 30–100 |
| Kundenzufriedenheit (Gesamttrend) | 200–400 |
| Kundenzufriedenheit (mit Untergruppenanalyse) | 500–1.000 |
| Marken- / Marktforschung | 1.000–3.000 |
| Public Policy / Großstatistik | 5.000+ |
Ein „komfortabler Puffer"
- Schätzt die Abschlussrate niedrig (60 % statt 70 %)
- Rechnet mit Bereinigungsverlusten (5–10 % werden post-cleaning ausgeschlossen)
- Lasst Raum für unerwartete Untergruppenanalyse (für den größten Fall planen)
→ Plant 1,2–1,5× das theoretische Minimum als praktischen Puffer.
Drei häufige Fallen
1. Bei „384 reicht" stehen bleiben. Für Gesamttrends funktioniert 384. Für Untergruppenanalyse nicht. Bevor ihr dem Stichprobenplan zustimmt, klärt die Kreuztabellen-Achsen, die das Team plant. „Alter × Beruf × Region" verlangt 1.500+, nicht 384.
2. Benötigtes N als benötigte Einladungen behandeln. „Lade 384 ein, bekomme 384 Antworten" ist der häufigste Fehler. Abschlussraten variieren stark nach Kanal (Panel: 60–80 %, Mail-Listen: 5–15 %, Social: 1–5 %). Immer rückwärts rechnen: Einladungen = N ÷ IR ÷ Abschlussrate.
3. Pilot überspringen, wenn IR unbekannt ist. Mit „ich nehme 40 % IR an" in den Hauptlauf gehen — und feststellen, dass die echte IR 10 % ist — vervierfacht eure Einladungskosten. Ein 30–50-Pilot zur IR-Messung verhindert solche Kostenkatastrophen.
Das richtige Tool wählen — Free-Plan-Grenzen, Verzweigungs-Support, KI-Fähigkeiten und CSV-Export variieren stark zwischen Tools. Siehe unseren Vergleich kostenloser Umfrage-Tools, um das passende für diesen Ansatz zu finden.
Zusammenfassung — 5 Schritte
| Schritt | Aufgabe | Zeit |
|---|---|---|
| 1 | Ziel mit drei Zahlen festlegen (Konfidenz, Fehler, Population) | 2 min |
| 2 | Formel oder Tabelle nutzen | 3 min |
| 3 | Für Untergruppen anpassen | 5 min |
| 4 | Einladungen aus IR und Abschlussrate berechnen | 3 min |
| 5 | Praktischen Puffer addieren (×1,2–1,5) | 2 min |
| Gesamt | — | 15 min |
Die Antwort auf „wie viele Befragte brauche ich?" ist 384 für Gesamttrends, 500–1.500 für Untergruppenanalyse in den meisten praktischen Fällen. Für die vollständigen statistischen Grundlagen siehe den Leitfaden zur Stichprobengrößenbestimmung.
Nach der Stichprobenbestimmung
Sobald N feststeht, prüft es bei der Aggregation und beim Signifikanztest erneut. Sowohl „N zu klein, um eine echte Differenz zu erkennen" als auch „N so groß, dass triviale Differenzen statistisch signifikant werden" sind häufige Praxisfallen. Siehe Aggregation und Signifikanztest.
Probiert Kicue — ein kostenloses Umfrage-Tool: Fragebogendatei hochladen, KI generiert das Web-Umfrageformular automatisch. Screening, Quotenmanagement und Live-Antwort-Monitoring sind Standardausstattung — Stichprobendesign geht sauber in den Betrieb über.
