Stichprobengröße für Umfragen berechnen — Konfidenzniveaus, Formeln und die 384-Regel

Fazit: Bei 95 % Konfidenz und ±5 % Fehlerspanne braucht ihr 384 Befragte, sobald die Population groß genug ist. Das ist die Industriebasis aus Cochrans Formel. Der Grund ist einfach: sobald die Population etwa 10 000 überschreitet, konvergiert die benötigte Stichprobengröße mathematisch gegen einen nahezu konstanten Wert. Egal ob 1 Million oder 100 Millionen — ihr braucht etwa 400 Befragte.

Aber „384 und fertig" stimmt nicht ganz. Untergruppenanalyse, IR (Inzidenzrate) und Antwortqualität können den praktischen Bedarf jeweils auf das 1,5–3-Fache hochtreiben. Dieser Beitrag erklärt in fünf Schritten, wie ihr die richtige Stichprobengröße bestimmt.

Schritt 1: Ziel mit drei Zahlen festlegen (2 min)

Die Stichprobengröße wird durch drei Parameter bestimmt:

① Konfidenzniveau

„Wenn ihr dieselbe Umfrage 100-mal laufen ließet, wie oft sollte das Ergebnis im wahren Bereich liegen?"

Konfidenz	Anwendung	Z-Wert
90 %	Schnelle Lesungen, Exploration	1,645
95 % (Standard)	Industriestandard	1,96
99 %	Medizin / regulatorisch	2,576

95 % ist der Default für akademische Papers, Marktforschung und operative Entscheidungen.

② Fehlerspanne (Margin of Error)

„Wie viele Prozentpunkte Fehler akzeptiert ihr um euer berichtetes % herum?"

Fehlerspanne	Anwendung	Benötigtes N
±10 %	Grob oder Pilot	~100
±5 % (Standard)	Industriestandard	~384
±3 %	Hochpräzise Forschung	~1.067
±1 %	Nationale Wahlumfragen, Census-Niveau	~9.604

Die Fehlerspanne zu halbieren vervierfacht die benötigte Stichprobengröße. Deshalb springt N von 384 auf 1.067, wenn ihr von ±5 % auf ±3 % wechselt.

③ Populationsgröße

Population	Benötigtes N (95 %, ±5 %)
100	80
500	217
1.000	278
5.000	357
10.000	370
100.000+	~384

Das benötigte N konvergiert, wenn die Population wächst. Für Umfragen unter „allen Konsumenten" oder „allen SNS-Nutzern" reicht es, sich nur die 384 zu merken.

Schritt 2: Formel benutzen (nur wenn nötig, 3 min)

Für die meisten Fälle reicht die Tabelle oben, aber die Formel zu kennen erweitert das Urteilsvermögen.

Cochrans Formel (unendliche Population)

n = (Z² × p × (1−p)) / e²

Z: Z-Wert für Konfidenz (1,96 bei 95 %)
p: erwarteter Anteil (0,5 verwenden, wenn unbekannt — das Maximum)
e: Fehlerspanne (0,05 bei ±5 %)

Für 95 % Konfidenz, ±5 % Fehler, p=0,5:

n = (1,96² × 0,5 × 0,5) / 0,05² = 3,8416 × 0,25 / 0,0025 = 384,16 → 385

Korrektur für endliche Population

Bei Population ≤10.000 könnt ihr den Bedarf reduzieren:

n_adj = n / (1 + (n − 1) / N)

Beispiel: Population = 1.000 → 385 / (1 + (385−1)/1000) = 385 / 1,384 = 278.

Online-Rechner

Keine Lust auf Mathe? SurveyMonkeys Rechner und andere erledigen das in Sekunden.

Schritt 3: Anpassung für Untergruppenanalyse (5 min)

Hier divergieren How und Spezialartikel — und das ist der am häufigsten übersehene Schritt.

Wenn ihr 384 für das Gesamtbild sammelt und dann nach Geschlecht × Altersgruppe trennt, hat jede Zelle 30–50 Befragte. Untergruppenzahlen sind nicht mehr zuverlässig auf dieser Tiefe.

Zellgrößen für Untergruppen

Analysetiefe	Benötigtes Gesamt-N
Nur Gesamt (einzelne GT)	384
Geschlecht × Alter (8 Zellen)	50 × 8 = 400–800
Geschlecht × Alter × Region (24 Zellen)	30 × 24 = 700–1.500
Vier-Wege-Kreuze (48 Zellen)	1.500–3.000

Für Untergruppenanalyse ist N≥30 pro Zelle die Untergrenze. Darunter werden Untergruppen-Mittelwerte und -Prozente im Wesentlichen uninterpretierbar.

Häufiger Fehler: „wir analysieren das ja sowieso noch tiefer"

Ein Kunde fragt „können wir auch Alter × Beruf × Region anschauen?" — und ihr akzeptiert mit nur 384 erhobenen. Ergebnis: jede Zelle hat 5 Befragte, die Kreuztabellen sind Rauschen. Wenn ihr akzeptiert, plant N=1.500–2.000 für eine echte 3-Wege-Untergruppenanalyse.

Schritt 4: IR und Antwortquote einbeziehen (3 min)

Im Feld sind „wie viele einladen" und „wie viele werden antworten" zwei verschiedene Zahlen.

Formel

Erforderliche Einladungen = Benötigtes N ÷ IR ÷ Abschlussrate

IR (Inzidenzrate): Anteil der Eingeladenen, der für die Umfrage qualifiziert
Abschlussrate: Anteil derjenigen, die begonnen haben, der fertig wird

Beispiel: 384 Frauen in den 30ern, die Lebensmittelzustellung nutzen

IR: unter 30er-Frauen nutzen ~40 % Lebensmittelzustellung → IR = 0,4
Abschlussrate (typisch): 70 % → 0,7

Erforderliche Einladungen = 384 / 0,4 / 0,7 = 1.371

Also müsst ihr das Screening an ~1.400 Personen verteilen, um 384 qualifizierte Abschlüsse zu landen. Die volle Mechanik im Leitfaden zu Screening-Fragen-Design und Betrieb.

Wenn IR unbekannt ist

Nutzt vorherige interne Daten oder Branchenberichte (Statista, Branchenverbände). Wenn nichts vorliegt, lasst einen Pilot mit N=30–50 laufen, um die IR vor dem Hauptlauf zu messen. Siehe Leitfaden für Pilotstudien.

Schritt 5: Der praktische Sweetspot (3 min)

Theoretisches und Feld-N unterscheiden sich. In der Praxis landen die meisten Projekte zwischen N=200 und N=500.

Praxisfaustregeln

Szenario	Empfohlenes N
Interne Team-Umfrage	30–100
Kundenzufriedenheit (Gesamttrend)	200–400
Kundenzufriedenheit (mit Untergruppenanalyse)	500–1.000
Marken- / Marktforschung	1.000–3.000
Public Policy / Großstatistik	5.000+

Ein „komfortabler Puffer"

Schätzt die Abschlussrate niedrig (60 % statt 70 %)
Rechnet mit Bereinigungsverlusten (5–10 % werden post-cleaning ausgeschlossen)
Lasst Raum für unerwartete Untergruppenanalyse (für den größten Fall planen)

→ Plant 1,2–1,5× das theoretische Minimum als praktischen Puffer.

Drei häufige Fallen

1. Bei „384 reicht" stehen bleiben. Für Gesamttrends funktioniert 384. Für Untergruppenanalyse nicht. Bevor ihr dem Stichprobenplan zustimmt, klärt die Kreuztabellen-Achsen, die das Team plant. „Alter × Beruf × Region" verlangt 1.500+, nicht 384.

2. Benötigtes N als benötigte Einladungen behandeln. „Lade 384 ein, bekomme 384 Antworten" ist der häufigste Fehler. Abschlussraten variieren stark nach Kanal (Panel: 60–80 %, Mail-Listen: 5–15 %, Social: 1–5 %). Immer rückwärts rechnen: Einladungen = N ÷ IR ÷ Abschlussrate.

3. Pilot überspringen, wenn IR unbekannt ist. Mit „ich nehme 40 % IR an" in den Hauptlauf gehen — und feststellen, dass die echte IR 10 % ist — vervierfacht eure Einladungskosten. Ein 30–50-Pilot zur IR-Messung verhindert solche Kostenkatastrophen.

Das richtige Tool wählen — Free-Plan-Grenzen, Verzweigungs-Support, KI-Fähigkeiten und CSV-Export variieren stark zwischen Tools. Siehe unseren Vergleich kostenloser Umfrage-Tools, um das passende für diesen Ansatz zu finden.

Zusammenfassung — 5 Schritte

Schritt	Aufgabe	Zeit
1	Ziel mit drei Zahlen festlegen (Konfidenz, Fehler, Population)	2 min
2	Formel oder Tabelle nutzen	3 min
3	Für Untergruppen anpassen	5 min
4	Einladungen aus IR und Abschlussrate berechnen	3 min
5	Praktischen Puffer addieren (×1,2–1,5)	2 min
Gesamt	—	15 min

Die Antwort auf „wie viele Befragte brauche ich?" ist 384 für Gesamttrends, 500–1.500 für Untergruppenanalyse in den meisten praktischen Fällen. Für die vollständigen statistischen Grundlagen siehe den Leitfaden zur Stichprobengrößenbestimmung.

Nach der Stichprobenbestimmung

Sobald N feststeht, prüft es bei der Aggregation und beim Signifikanztest erneut. Sowohl „N zu klein, um eine echte Differenz zu erkennen" als auch „N so groß, dass triviale Differenzen statistisch signifikant werden" sind häufige Praxisfallen. Siehe Aggregation und Signifikanztest.

Probiert Kicue — ein kostenloses Umfrage-Tool: Fragebogendatei hochladen, KI generiert das Web-Umfrageformular automatisch. Screening, Quotenmanagement und Live-Antwort-Monitoring sind Standardausstattung — Stichprobendesign geht sauber in den Betrieb über.