Forschungsmethoden

Leitfaden für Kundensegmentierungs-Befragungen — Kunden per Clusteranalyse einteilen

Wie man Kundensegmentierungs-Befragungen so gestaltet, dass aus Umfragedaten sinnvolle Kundensegmente entstehen. Der Unterschied zwischen A-priori- und Post-hoc-Segmentierung (Clusteranalyse), die vier Segmentierungsachsen Demografie, Verhalten, Bedürfnisse und Psychografie, die Wahl zwischen hierarchischer Clusteranalyse, k-Means und Latent-Class-Analyse, die Bestimmung der Segmentanzahl bis hin zu den sechs Bedingungen für brauchbare Segmente — geordnet entlang der Segmentierungsforschung seit Smith (1956) und dem Bauchgefühl der Praxis.

Die Key-Driver-Analyse hat ergeben: „Was die Gesamtzufriedenheit bewegt, ist der Support." Die Importance-Performance-Analyse hat entschieden: „Schwerpunkt der Verbesserung sind Support und Preis." Doch hinter diesen Schlüssen steckt eine verborgene Annahme — die Annahme, dass „Kunden ein einziger Block sind".

In Wirklichkeit unterscheiden sich die zufriedenheitstreibenden Faktoren bei einem preissensiblen Neukunden und bei einem Heavy User, der funktionale Tiefe sucht, vollkommen. Wenn im Gesamtdurchschnitt „der Support wirkt" herauskommt, ist das nur das Ergebnis zweier verschiedener Kundengruppen, die zusammengemischt und gemittelt wurden — und für keine der beiden Gruppen ist es zutreffend. In der Statistik nennt man das das Problem, dass „es den durchschnittlichen Kunden nicht gibt". Genau das löst die Kundensegmentierungs-Befragung. Aus den Umfragedaten findet man „Blöcke von Gleichartigen" und passt die Strategie pro Block an. Dieser Beitrag ordnet — mit dem Gefühl der Praxis — die beiden großen Segmentierungsansätze, die Wahl der Segmentierungsachsen, die Verfahren der Clusteranalyse, die Bestimmung der Segmentanzahl und schließlich die „Bedingungen für ein brauchbares Segment".

1. Warum überhaupt segmentieren — die Falle des Gesamtdurchschnitts

Sowohl die Key-Driver-Analyse als auch die Importance-Performance-Analyse (IPA) sind mächtig, teilen aber dieselbe Schwäche: Sie mitteln alle Befragten als eine einzige Grundgesamtheit.

Mischt man heterogene Kunden und mittelt sie, entsteht ein Phänomen nahe dem Simpson-Paradoxon. „Insgesamt ist der Support der größte Zufriedenheitstreiber", aber in Segment A ist es der Preis und in Segment B die Funktionalität — das ist Alltag. Entscheidet man allein auf Basis des Gesamtdurchschnitts, investiert man in durchschnittliche, mittelmäßige Maßnahmen, die bei keinem Segment ankommen.

Das Ziel der Segmentierung ist einfach: In „Blöcke von Kunden mit ähnlicher Reaktion" einteilen und pro Block die optimale Maßnahme variieren. Seit der Klassiker Smith (1956) die „Marktsegmentierung" in Abgrenzung zur „Produktdifferenzierung" vorschlug, ist die Segmentierung das Fundament der Marketingstrategie geblieben.

Lässt man KDA / IPA getrennt pro Segment erneut laufen, werden „die je nach Segment unterschiedlichen Treiber sichtbar, die im Gesamtbild nicht zu erkennen waren". Die Segmentierung ist das letzte Teil der analytischen Trilogie (Faktoren identifizieren → Priorisieren → Kunden einteilen).

2. A-priori- vs. Post-hoc-Segmentierung — zwei Ansätze

Es gibt zwei grundlegend verschiedene Arten, Kunden einzuteilen. Verwechselt man sie, gestaltet man die Analyse falsch.

A-priori-Segmentierung (A priori / Descriptor-based)

Die Methode, bei der der Analyst nach vorab festgelegten Kriterien mechanisch einteilt. „Nach Altersgruppe", „nach Vertragstarif", „nach Nutzungshäufigkeit" und so weiter. Die Kriterien sind klar, der Betrieb ist einfach, und jeder kann es reproduzieren.

Die Schwäche: Es ist nicht gesagt, dass dieses Kriterium das Kundenverhalten tatsächlich trennt. „Wir haben nach 20- und 30-Jährigen getrennt, aber tatsächlich war das Kaufverhalten beider nahezu identisch" — das kommt häufig vor. Man bildet sich nur ein, eingeteilt zu haben, ändert aber nichts an der Maßnahme.

Post-hoc-Segmentierung (Post-hoc / Cluster-based)

Die Methode, bei der man aus den Antwortmustern der Befragung (Zufriedenheit, Bedürfnisse, Werthaltungen usw.) datengetrieben „natürliche Blöcke" entdeckt. Man nutzt Clusteranalyse oder Latent-Class-Analyse. Es ist ein Ansatz, der „die Daten sprechen lässt", und es kommen Segmente zum Vorschein, die einem mit vorgefassten Annahmen entgangen wären.

Die Schwäche: Es kommen leicht jedes Mal andere Ergebnisse heraus, die Interpretation ist schwierig, und im Betrieb ist es schlecht reproduzierbar. Es braucht die Fähigkeit, zu interpretieren, „was dieses Segment eigentlich ist".

Das Prinzip der Aufgabenteilung

  • Zuerst mit der A-priori-Segmentierung den Ansatz abstecken: Nach Demografie- und Verhaltensdaten einteilen und prüfen, ob bei KDA/IPA ein Unterschied entsteht
  • Wenn kein Unterschied entsteht oder man tiefer bohren will, Post-hoc: Mit der Clusteranalyse nach Blöcken auf Basis von Bedürfnissen und Werthaltungen suchen
  • In der Praxis kombiniert man beides: Die per Post-hoc gefundenen Blöcke mit den Variablen der A-priori-Segmentierung (Altersgruppe, Tarif) „profilieren" und ihre wahre Identität fassen (Kapitel 6)

3. Die Wahl der Segmentierungsachsen — vier Variablentypen

Wonach teilt man ein? Segmentierungsvariablen gibt es grob in vier Typen, und zwischen „Leichtigkeit der Einteilung" und „Anschlussfähigkeit an Maßnahmen" besteht ein Zielkonflikt.

Die vier Typen von Segmentierungsvariablen

Demografisch (Bevölkerungsstatistik)
Alter, Geschlecht, Einkommen, Region, Beruf usw. Leicht zu erheben und gut beschreibbar, doch die erklärende Kraft fürs Verhalten ist schwach. Nicht alle „Frauen in den Dreißigern" kaufen gleich. Allein genommen schwach, geeignet als Stütze für andere Achsen.
Verhalten (Behavioral)
Nutzungshäufigkeit, Kaufbetrag, genutzte Funktionen, Verweildauer usw. Da auf tatsächlichem Verhalten beruhend, gut an Maßnahmen anschließbar. Die RFM-Analyse (Recency, Frequency, Monetary) ist der typische Vertreter. Lässt sich gut mit CRM-Daten verknüpfen.
Bedürfnisse / Benefits (gesuchter Wert)
„Worauf man bei der Wahl Wert legt." Preisorientiert, qualitätsorientiert, supportorientiert usw. Am unmittelbarsten an Produktentwicklung und Ansprache angeschlossen, erfordert aber ein sorgfältiges Befragungsdesign. Die Hauptrolle der Post-hoc-Segmentierung.
Psychografisch (Werthaltungen, Lebensstil)
Persönlichkeit, Werte, Lebensstil, Einstellungen. Erfasst tiefe Motive, ist aber schwer zu messen, und in die Interpretation fließt leicht Subjektivität ein. Der alleinige Einsatz ist etwas für Fortgeschrittene.

Die Faustregel der Praxis

  • Die Kombination aus Verhalten + Bedürfnissen erzeugt am ehesten die „brauchbarsten" Segmente
  • Demografie nutzt man nicht als Segmentierungsachse, sondern als Profilierungsachse (hinterher beschreibt man: „In diesem Segment sind viele in den Dreißigern")
  • Um Bedürfnisse und Benefits zu messen, ist das Design von Likert-Skalen-Fragen entscheidend. Siehe Leitfaden zum Design von Likert-Skalen

4. Die Verfahren der Clusteranalyse — hierarchisch, k-Means, Latent Class

Der Kern der Post-hoc-Segmentierung ist die Clusteranalyse. Die drei typischen Verfahren haben jeweils ihre passende Situation.

Hierarchische Clusteranalyse (Hierarchical)

Die Methode, bei der man die Stichprobe eine nach der anderen zusammenführt und im Baumdiagramm (Dendrogramm) die Struktur der Blöcke betrachtet. Der Vorteil: Man muss die Segmentanzahl nicht vorab festlegen und kann die Struktur visuell erfassen. Die Ward-Methode (Ward's method) wird häufig eingesetzt. Die Schwäche ist der hohe Rechenaufwand: Übersteigt die Stichprobe einige Tausend, wird es schwerfällig. Geeignet für kleine bis mittlere Stichproben oder die Explorationsphase.

k-Means

Die Methode, bei der man die Segmentanzahl k vorab vorgibt, jeden Punkt dem nächstgelegenen Schwerpunkt zuordnet, den Schwerpunkt aktualisiert und das wiederholt. Auch bei großen Datenmengen schnell und am weitesten verbreitet. Schwächen: (1) k muss vorab festgelegt werden, (2) das Ergebnis schwankt durch die Abhängigkeit von den Startwerten (mehrfach ausführen und die Stabilität prüfen), (3) empfindlich gegenüber der Skala der Variablen (unbedingt erst standardisieren, dann einspeisen).

Latent-Class-Analyse (Latent Class Analysis, LCA)

Ein statistisches Modell, das annimmt: „Jeder Befragte gehört mit einer gewissen Wahrscheinlichkeit zu einer der latenten Klassen." Seit Kamakura & Russell (1989) hat es sich im Marketing weiterentwickelt. Vorteile: Man kann die Segmentanzahl nach statistischen Kriterien (z. B. BIC) wählen, und kategoriale Variablen lassen sich natürlich handhaben. Die Schwäche ist die hohe Fachlichkeit und der Bedarf an Spezialsoftware (Latent GOLD, poLCA in R usw.).

Vorverarbeitung: mit der Faktorenanalyse die Dimensionen verdichten

Wenn es 20 oder 30 Fragen gibt und man sie unverändert in die Clusteranalyse einspeist, gewichten miteinander korrelierte Fragen dasselbe Konzept doppelt. Die Faustregel: Erst mit der Faktorenanalyse (factor analysis) auf Faktoren wie „Preisorientierung" oder „Qualitätsorientierung" verdichten und dann anhand der Faktorwerte clustern. Im Leitfaden zu Reliabilität und Validität von Befragungen wird der Zusammenhang von Faktorenanalyse und Konstrukten behandelt.

5. Wie man die Segmentanzahl bestimmt — statistische Kennzahlen und Interpretierbarkeit

„In wie viele teilt man ein?" ist die größte Sorge der Segmentierung. Man entscheidet sowohl nach statistischen Kennzahlen als auch nach der betriebswirtschaftlichen Interpretierbarkeit.

Statistische Anhaltspunkte

  • Ellenbogen-Methode (Elbow Method): Man wählt den „Ellenbogen"-Punkt, an dem die „Abnahme der Quadratsumme innerhalb der Gruppen" beim Erhöhen der Clusteranzahl flacher wird
  • Silhouettenkoeffizient (Silhouette): Bewertet von −1 bis 1, wie gut jeder Punkt zu seinem eigenen Cluster passt und wie weit er vom benachbarten Cluster entfernt ist. Die Kennzahl von Rousseeuw (1987); je näher an 1, desto besser
  • Bei der Latent-Class-Analyse BIC / AIC: Man wählt die Clusteranzahl mit dem minimalen Informationskriterium

Die endgültige Entscheidung fällt jedoch über die „Interpretierbarkeit"

Auch wenn die statistische Kennzahl „6 Segmente sind optimal" ausgibt — wenn man die sechs nicht in Worte fassen kann, ist es bedeutungslos. In der Praxis landet man oft bei 3–6 Segmenten. Der Grund ist einfach: Ab sieben kann man die Maßnahmen nicht mehr getrennt ausspielen (es fehlen die Ressourcen der Organisation).

„Auch wenn es statistisch optimal ist — eine Segmentanzahl, die man im Geschäft nicht bewegen kann, übernimmt man nicht." Das ist die eiserne Regel der Festlegung der Segmentanzahl. Die Statistik schlägt nur Kandidaten vor; die endgültige Entscheidung lautet: „Kann man pro Segment eine andere Maßnahme ausspielen?"

6. Profilierung und Persona-Bildung — die sechs Bedingungen für ein brauchbares Segment

Sind die Cluster heraus, beschreibt man, „was jedes einzelne ist" (Profilierung). Für jedes Segment ermittelt man die Mittelwerte von Demografie, Verhalten und Bedürfnissen, fasst es in Worte wie „Dieses Segment ist preisorientiert, hat viele in den Dreißigern und ist eine Neukundenschicht mit geringer Nutzungshäufigkeit" und formt es bei Bedarf zu einer Persona.

Allerdings ist nicht jeder statistisch getrennte Block auch ein „brauchbares Segment". Man prüft, ob die von Kotler geordneten Bedingungen für ein in der Praxis brauchbares Segment erfüllt sind.

  • Messbar (Measurable): Größe und Eigenschaften des Segments lassen sich messen
  • Erreichbar (Accessible): Man kann das Segment über Werbung und Vertrieb erreichen
  • Substanziell (Substantial): Es hat eine zur Investition passende Größe (für ein 1-%-Segment kann man keine eigene Maßnahme fahren)
  • Differenzierbar (Differentiable): Die Reaktion unterscheidet sich klar von anderen Segmenten
  • Handlungsrelevant (Actionable): Für dieses Segment lassen sich konkrete Maßnahmen entwerfen und umsetzen
  • Stabil (Stable): Es verschwindet nicht kurzfristig, sondern ist zeitlich ein stabiles Segment

Ein Segment, das „statistisch sauber getrennt ist, für das es aber kein Zugangsmittel gibt und das zudem klein ist", ist als Analyse zwar korrekt, im Geschäft aber unbrauchbar. In der Profilierungsphase siebt man mit diesen sechs Bedingungen.

7. Die Sicht der Redaktion — fünf Dinge, die man bei der Segmentierung nicht tun sollte

Aus der Position, die Branchenfälle und die Stimmen der Praktiker fortlaufend verfolgt, fünf Unfälle, die bei der Segmentierung immer wieder passieren.

1. Ohne Standardisierung der Variablen clustern

Der häufigste und am wenigsten bemerkte Unfall. Speist man „Einkommen (in Zehntausend, mehrere Hundert bis mehrere Tausend)" und „Zufriedenheit (1 bis 5)" ohne Standardisierung in k-Means, bestimmen sich die Blöcke allein über das großskalige Einkommen, und die Zufriedenheit wird nahezu ignoriert. Vor dem Clustern alle Variablen standardisieren (z-Werte bilden). Eine Analyse, die das vergisst, ist fast sicher falsch.

2. Allein nach Demografie einteilen und sich „eingeteilt" fühlen

Es endet mit „Wir haben nach 20-, 30- und 40-Jährigen getrennt". Wenn das Kaufverhalten trotz Einteilung nach Altersgruppe gleich ist, ist das keine Segmentierung, sondern bloß eine Auszählung. Demografie ist keine Segmentierungsachse, sondern eine Profilierungsachse. Man hält die Reihenfolge ein: nach Verhalten und Bedürfnissen einteilen, mit Demografie beschreiben.

3. Die Segmentanzahl allein nach statistischen Kennzahlen festlegen

Man übernimmt 8 Segmente, weil der Silhouettenkoeffizient am höchsten ist, die Organisation kann sie nicht getrennt ausspielen, und sie bleiben liegen. Die „Anzahl, die man getrennt ausspielen kann" ist die Obergrenze, und die Statistik wählt das Optimum innerhalb dieser Grenze. 3–6 ist der realistische Landepunkt.

4. Ein einmal erstelltes Segment für immer weiterverwenden

Man verwendet ein vor zwei Jahren erstelltes Segment auch jetzt noch, da sich der Markt verändert hat. Segmente sind verderbliche Ware. Verändern sich Markt, Kunden und Produkt, verändern sich auch die Blöcke. Regelmäßig (etwa einmal jährlich) das Clustern neu durchführen und die Stabilität der Segmente (Bedingung 6) prüfen.

5. Segmente bilden, obwohl die Stichprobe klein ist

Teilt man N=150 auf 6 Segmente, sind das im Schnitt 25 Personen pro Segment. Die Werte pro Segment sind voller Fehler, und „Segment A hat eine hohe Zufriedenheit" zu sagen, ist bei N=20 bedeutungslos. Wenn man die Segmentierung voraussetzt, sollte man eine Stichprobe so planen, dass man pro Segment mindestens 50 bis 100, möglichst je 100 oder mehr sicherstellt. Siehe Wie man die nötige Stichprobengröße bestimmt.

8. Kundensegmentierungs-Befragungen mit dem Umfrage-Tool Kicue

Eine Segmentierungs-Befragung teilt sich in die Phase „die Fragen messen, die als Grundlage der Einteilung dienen" und die Analysephase „mit der Clusteranalyse die Blöcke finden". Kicue übernimmt die erste; die zweite ist eine Kombination mit externen Statistik-Tools.

  • Messung der Segmentierungsvariablen: Unterstützt das Design von Likert-Skalen- sowie Einfach-/Mehrfachauswahl-Fragen zur Messung von Bedürfnissen, Werthaltungen und Verhalten (Fragetypen)
  • Beilage von Demografie- und Verhaltensfragen: Erfasst die zur Profilierung genutzten Attribute (Altersgruppe, Tarif, Nutzungshäufigkeit) im selben Formular
  • CSV-Export mit Respondenten-ID: Ausgabe in einer Struktur, die mit einer Zeile pro Antwort alle Fragen aufreiht und sich direkt in die Clusteranalyse einspeisen lässt. Nach der Analyse lässt sich „welcher Befragte zu welchem Segment gehört" auch wieder mit dem CRM verknüpfen
  • GT-Auszählung und Kreuztabellen: Bis zur Kreuztabelle der A-priori-Segmentierung (etwa nach Altersgruppe) ist im Dashboard möglich

⚠️ Was mit Kicue nicht abgedeckt ist

  • Keine Funktion für Clusteranalyse, k-Means, hierarchische Clusteranalyse oder Latent-Class-Analyse: Die statistische Auswertung erfolgt mit R (cluster, poLCA usw.) / Python (scikit-learn) / SPSS / Latent GOLD. Kicue selbst ist keine statistische Auswertungsfunktion verliehen worden
  • Auch keine Faktorenanalyse oder Standardisierung von Variablen: Die Vorverarbeitung fürs Clustern erfolgt nach dem Export auf Seiten der Statistiksoftware
  • Auch keine segmentbezogene Treiberanalyse (KDA): Man übergibt die CSV an ein externes Tool und lässt es pro Segment laufen
  • Auch keine automatische Persona-Generierung: Die Persona-Bildung aus den Profilierungsergebnissen erfolgt manuell + mit BI-Tools

Als verwandte Beiträge ergeben gemeinsam gelesen der Leitfaden zur Key-Driver-Analyse, der Leitfaden zur Importance-Performance-Analyse (IPA), der Leitfaden zu Stichprobenverfahren in Befragungen, der Leitfaden zu Design und Betrieb von Screening-Fragen und der Leitfaden zu Reliabilität und Validität von Befragungen ein Bild der gesamten Analyse-Pipeline „Design → Einteilung → segmentbezogene Faktorenanalyse → Priorisierung".

Fazit — sechs Punkte, um Kundensegmentierung zu einer brauchbaren Analyse zu machen

  1. Sich der Falle des Gesamtdurchschnitts bewusst sein — lässt man KDA/IPA getrennt pro Segment laufen, werden verborgene Unterschiede sichtbar
  2. Nach Verhalten und Bedürfnissen einteilen, mit Demografie beschreiben — eine reine Demografie-Einteilung endet im „Gefühl, eingeteilt zu haben"
  3. Vor dem Clustern unbedingt standardisieren — damit großskalige Variablen die Blöcke nicht kapern
  4. Die Segmentanzahl hat die „Anzahl, die man getrennt ausspielen kann" als Obergrenze — die statistische Kennzahl wählt das Optimum innerhalb dieser Grenze (3–6 ist die realistische Lösung)
  5. Mit den sechs Bedingungen (Messbar, Erreichbar, Substanziell, Differenzierbar, Handlungsrelevant, Stabil) sieben — ein statistischer Block ≠ ein brauchbares Segment
  6. Bei vorausgesetzter Segmentierung je 100 oder mehr sicherstellen — zerstückelt man eine kleine Stichprobe, ist sie voller Fehler

Bei der Kundensegmentierung ist nicht das „Durchführen einer hochentwickelten Clusteranalyse" das Ziel. Indem man die drei Punkte Standardisierung, Interpretierbarkeit und Handlungsrelevanz nicht verfehlt, kommt man aus der Illusion des „durchschnittlichen Kunden" heraus und erhält eine Analyse, die das Fundament der Strategie bildet — eine, mit der man pro Block treffende Maßnahmen entwerfen kann.


Wer die Befragung gestalten möchte, die der Segmentierung zugrunde liegt, sollte das kostenlose Umfrage-Tool Kicue ausprobieren. Mit dem Design von Likert-/Auswahlfragen zur Messung von Bedürfnissen, Verhalten und Attributen sowie dem CSV-Export mit Respondenten-ID lässt sich der Teil, der die Eingabedaten für die Clusteranalyse erzeugt, in einem einzigen Konto starten (Clusteranalyse, Faktorenanalyse, Latent-Class-Analyse und die Standardisierung von Variablen laufen in Kombination mit R / Python / SPSS / Latent GOLD).

Literatur

Verwandte Artikel

Forschungsmethoden

Leitfaden für Konzepttests — Akzeptanz vor dem Launch messen

Wie man Konzepttests gestaltet, um neue Produkte, neue Funktionen oder Werbecopy schon vor dem Launch per Befragung zu bewerten. Wann monadische, sequenziell monadische oder vergleichende Tests sinnvoll sind, die Standardkennzahlen Kaufabsicht, Neuartigkeit, Attraktivität und Einzigartigkeit, das Lesen von Top-Box-Werten, warum der Vergleich mit Normen (Benchmarks) entscheidend ist und wie man das Stimulus-Material (den Konzepttext) ausarbeitet — geordnet entlang des Bauchgefühls der Praxis. Der Einstieg in die Pre-Launch-Forschung, die PSM, Conjoint und MaxDiff vorgelagert ist.

Forschungsmethoden

Key-Driver-Analyse — Was Zufriedenheit und NPS bewegt

Wie die Key-Driver-Analyse (Key Driver Analysis) die Faktoren identifiziert, die Gesamtzufriedenheit und NPS bewegen. Von der Falle, allein nach Korrelationskoeffizienten zu urteilen, über das Multikollinearitätsproblem der multiplen Regression, dessen Lösung durch Shapley-Werte und relative Gewichte (Johnson's Relative Weights), bis zur größten Fehlinterpretation überhaupt — der Verwechslung von Korrelation und Kausalität. Geordnet entlang der Forschung zur relativen Wichtigkeit seit Johnson (2000) und dem praktischen Bauchgefühl. Inklusive Einordnung als Quelle für die abgeleitete Wichtigkeit in der IPA (Importance-Performance-Analyse).

Forschungsmethoden

Importance-Performance-Analyse (IPA) — Verbesserungen in 4 Quadranten priorisieren

Ordnen Sie die Ergebnisse Ihrer Kundenzufriedenheitsbefragung in vier Quadranten ein — „vorrangig verbessern / halten / überzogene Qualität / niedrige Priorität

Möchten Sie selbst eine Umfrage mit Kicue erstellen?

Laden Sie Ihren Fragebogen hoch, und die AI generiert in 30 Sekunden ein Web-Umfrageformular.

Kostenlos starten