Importance-Performance-Analyse (IPA) — Verbesserungen in 4 Quadranten priorisieren

Die Zufriedenheitsbefragung ist abgeschlossen, und zehn Werte je Attribut liegen nebeneinander. Preis 3,8, Support 4,1, Bedienbarkeit 3,5, Funktionsumfang 4,3 … In dem Moment, in dem Sie das im Vorstand zeigen, kommt die Frage: „Und wo fangen wir jetzt an?"

Die Ressourcen, alle Zufriedenheitswerte gleichzeitig zu heben, gibt es nicht. Es braucht eine Reihenfolge. Aber „wir reparieren zuerst den niedrigsten Wert" ist ein Fehler. Denn selbst wenn ein Wert niedrig ist, bringt es nichts, ein Item zu verbessern, das dem Kunden egal ist. Die Rendite einer Verbesserung steckt genau dort, wo etwas „wichtig, aber wenig zufriedenstellend" ist. Das in einem einzigen Streudiagramm zu zeigen, ist die Aufgabe der Importance-Performance-Analyse (IPA). In diesem Beitrag fassen wir mit dem Praxisgefühl zusammen: vom Lesen der vier Quadranten über das Messen der Wichtigkeit (hier liegt die größte Weggabelung) und das Ziehen der Achsen bis hin zu den Fallen, die für Zufriedenheitsdaten typisch sind.

1. Warum man mit einer „Liste von Zufriedenheitswerten" nicht entscheiden kann

Ein Bericht, in dem die attributbezogenen Zufriedenheitswerte einfach als Balkendiagramm aufgereiht sind, ist der in der Forschungspraxis am häufigsten produzierte und gleichzeitig der am seltensten für Entscheidungen genutzte Output. Der Grund ist einfach: „niedriger Wert" und „Verbesserungspriorität" stimmen nicht überein.

Niedriger Wert ≠ Verbesserungspriorität

Selbst wenn die Zufriedenheit mit dem „PDF-Design der Rechnung" mit 3,2 niedrig ist: Wenn der Kunde darauf keinen Wert legt, bewegt sich die Loyalität durch eine Verbesserung kaum. Umgekehrt: Selbst wenn die „Reaktionsgeschwindigkeit des Supports" mit 3,9 mittelmäßig ist — wenn der Kunde genau das am höchsten gewichtet, ist der Effekt enorm, diesen Wert auf 4,3 zu heben.

Für die Entscheidung braucht es zwei Achsen — „wie stark wird das Item gewichtet (Wichtigkeit)" und „wie zufrieden ist man aktuell (Zufriedenheit)". Jedes Attribut auf diesen beiden Achsen abzutragen und in vier Quadranten zu teilen, ist die Grundidee der IPA. Seit Martilla & James sie 1977 in Importance-Performance Analysis (Journal of Marketing) vorschlugen, wird sie in CX, Servicequalität, Tourismus, Gesundheitswesen und vielen weiteren Feldern eingesetzt — ein langlebiger Rahmen.

Wie man die Zufriedenheit selbst misst (5-stufig oder 10-stufig, der Gedanke der Top-2-Box), behandeln wir im Designleitfaden für die Kundenzufriedenheit (CSAT). Dieser Beitrag geht einen Schritt weiter und handelt davon, wie man die gemessene Zufriedenheit in Verbesserungsmaßnahmen übersetzt.

2. Die 4 Quadranten der IPA — die Landkarte, wo man anfängt

Trägt man auf der vertikalen Achse die Wichtigkeit und auf der horizontalen Achse die Zufriedenheit ab und teilt sie jeweils am Mittelwert (oder Median) in vier Felder, fällt jedes Attribut in einen der folgenden vier Quadranten.

Die 4 Quadranten der IPA und ihre Maßnahmen

Vorrangiger Verbesserungsbereich (hohe Wichtigkeit × niedrige Zufriedenheit) — Concentrate Here

Der Kunde legt Wert darauf, ist aber nicht zufrieden. Der Bereich mit höchster Investitionspriorität. Man könnte sagen: In der IPA muss man als Allererstes nur hierher schauen. Lenken Sie die Produkt-Roadmap und das Verbesserungsbudget hierher.

Erhaltungsbereich (hohe Wichtigkeit × hohe Zufriedenheit) — Keep Up the Good Work

Wird hoch gewichtet und ist zugleich hoch zufriedenstellend — die Quelle des Wettbewerbsvorteils. Eher verteidigen als angreifen. Nutzen Sie ihn als Betrieb, der die Qualität nicht absinken lässt, und als Argument im Marketing.

Bereich überzogener Qualität (niedrige Wichtigkeit × hohe Zufriedenheit) — Possible Overkill

Verdacht auf Überinvestition in ein Item, das dem Kunden nicht wichtig ist. Kandidat für eine Umverteilung der Ressourcen. Prüfen Sie, ob man hier kürzen und stattdessen in den vorrangigen Verbesserungsbereich umlenken kann (der Kern ist Umverteilung, nicht Kürzung).

Bereich niedriger Priorität (niedrige Wichtigkeit × niedrige Zufriedenheit) — Low Priority

Wird weder gewichtet, noch ist die Zufriedenheit hoch. Vorerst kann man es liegen lassen. Bei niedrigen Werten will man reflexartig reparieren, aber eine Investition hier bemerkt der Kunde nicht. Ein Bereich, bei dem man bewusst entscheidet, „es nicht zu tun".

Grundsätze beim Lesen

Faktisch schaut man nur auf den „vorrangigen Verbesserungsbereich": Die 2-3 Items, die hier hineinfallen, werden zum Verbesserungsthema des nächsten Quartals
Überzogene Qualität eher „verschieben" als „kürzen": Lässt man wegen niedriger Wichtigkeit die Qualität absinken, wird das schmerzhaft, sobald die Wichtigkeit irgendwann steigt. Überprüfen Sie zunächst die Ressourcenverteilung
Den Drang unterdrücken, niedrige Priorität reparieren zu wollen: Sich von Items mit niedrigem Absolutwert ziehen zu lassen, ist die größte Falle. Betrachten Sie immer auch die Achse der Wichtigkeit

3. Wie man die Wichtigkeit misst — direkte Frage vs. statistische Ableitung

Über Erfolg oder Misserfolg der IPA entscheidet zu 80 Prozent, wie man die Wichtigkeit misst. Macht man das schludrig, wird die vertikale Achse der vier Quadranten unglaubwürdig und die gesamte Analyse bricht zusammen. Es gibt im Wesentlichen zwei Wege, die Wichtigkeit zu messen, und jeder hat eine genau entgegengesetzte Schwäche.

Methode A: Direkte Frage (explizite Wichtigkeit / Stated Importance)

Man fragt zusätzlich zur Zufriedenheit noch einmal: „Wie wichtig sind Ihnen die folgenden Items?". Einfach, aber mit einer fatalen Eigenheit.

Die Befragten antworten auf fast alles mit „wichtig". Niemand antwortet auf die Frage „Ist der Support wichtig?" mit „ist mir egal". Die Folge: Die Wichtigkeitswerte kleben durchgängig bei 4,0 bis 4,5 (Deckeneffekt), und zwischen den Items entsteht kaum ein Unterschied. Die vertikale Achse kollabiert, und die vier Quadranten funktionieren nicht mehr.

Methode B: Statistische Ableitung (abgeleitete Wichtigkeit / Derived Importance)

Hier betrachtet man den Korrelations- oder Regressionskoeffizienten zwischen der Zufriedenheit je Attribut und der „Gesamtzufriedenheit (oder Wiederkaufabsicht / NPS)" als „Wichtigkeit". Der Gedanke: „Wenn sich die Support-Zufriedenheit bewegt, bewegt sich auch die Gesamtzufriedenheit stark → der Support ist wichtig." Man fragt die Befragten nicht direkt nach der Wichtigkeit.

So lässt sich der Deckeneffekt der direkten Frage vermeiden; im Gegenzug gibt es Schwächen wie Multikollinearität (die Attribute korrelieren untereinander, sodass die Koeffizienten instabil werden) und die Verwechslung von Korrelation und Kausalität. Die Praxis der Korrelation und Regression, die der Ableitung zugrunde liegt, ist im Leitfaden zur Umfrageauswertung und Signifikanzprüfung aufbereitet.

Schlussfolgerung für die Praxis: beide betrachten und die „Lücke" lesen

Sowohl akademisch als auch praktisch gilt als am besten, sowohl die explizite als auch die abgeleitete Wichtigkeit zu messen und die Abweichung (Lücke) zwischen beiden zu lesen.

Items, bei denen „direkt befragt zwar als wichtig genannt wird, der Einfluss auf die Gesamtzufriedenheit aber gering ist" → die vorgeschobene Position des Kunden. Die Stimme ist laut, das Verhalten bewegt sie nicht
Items, bei denen „direkt befragt nicht der Rede wert sind, aber die Gesamtzufriedenheit stark bewegen" → vom Kunden selbst nicht bewusst wahrgenommene verdeckte Treiber. Hier liegt die Goldgrube

Die abgeleitete Wichtigkeit ist ein Gedanke, der nahtlos an die im Folgenden beschriebene „Key-Driver-Analyse" anschließt, und die IPA ist der Ausgang, der dieses Ergebnis in vier Quadranten sichtbar macht.

4. Aufbau des Streudiagramms — die unscheinbare, aber gravierende Wahl des Teilungspunkts

Wo zieht man das Fadenkreuz, das die vier Quadranten teilt? Das beeinflusst die Schlussfolgerung mehr, als es aussieht. Es gibt im Wesentlichen drei Optionen.

Teilungspunkt	Eigenschaft	Geeignetes Szenario
Mittelwert	Relative Bewertung. Vor- und Nachteile innerhalb der eigenen Item-Gruppe	Am gängigsten. Interne Priorisierung von Verbesserungen
Median	Robust gegenüber Ausreißern. Stabil, auch wenn die Verteilung schief ist	Wenn die Zufriedenheit zur Hochwertseite schief ist (Gegenmaßnahme gegen den später beschriebenen Deckeneffekt)
Skalenmittelpunkt (bei 5 Stufen 3,0)	Absolute Bewertung. „Ist die Bestehensgrenze überschritten?"	Wettbewerbsvergleich oder Beurteilung des absoluten Niveaus

Die Falle der Mittelwert-Teilung — „Fügt man ein Item hinzu, ändert sich die Schlussfolgerung"

Die am häufigsten genutzte Mittelwert-Teilung hat eine leicht übersehene Schwäche: Weil die Trennlinie der Mittelwert aller Items ist, verschiebt sie sich schon dann, wenn man ein einziges Item hinzufügt oder entfernt — und ein Attribut kann vom vorrangigen Verbesserungsbereich in den Erhaltungsbereich springen.

„Im Bericht des letzten Monats war der Support noch vorrangig zu verbessern, diesen Monat liegt er im Erhaltungsbereich. Dabei haben wir keine einzige Maßnahme ergriffen." — Nicht selten ist das kein Fall einer Verbesserung, sondern schlicht: Die ausgewerteten Items haben sich geändert und die Mittelwertlinie hat sich verschoben. Wenn Sie den Mittelwert als Teilungspunkt verwenden, fixieren Sie das Item-Set und vermerken Sie unbedingt die Lage der Linie.

Den Aufbau des Streudiagramms selbst (die 2-Achsen-Darstellung in Excel, Achsenbeschriftung und Hilfslinien der Quadranten) behandeln wir im Leitfaden zur Visualisierung von Umfrageergebnissen und im Leitfaden zur Umfrageauswertung in Excel.

5. Der Deckeneffekt bei Zufriedenheitsdaten — die größte Falle der IPA

Was die Analyse in der IPA am häufigsten zerstört, ist der „Deckeneffekt", bei dem die Zufriedenheitsdaten zur Hochwertseite schief sind.

Die Kundenzufriedenheit fällt strukturell zu hoch aus. Auf einer 5-stufigen Skala konzentriert sie sich um Mittelwerte von 4,0 bis 4,5, und Items unter 3,0 sind selten (auch eine Stichprobenverzerrung wirkt: unzufriedene Kunden antworten oft gar nicht erst, sondern sind bereits abgewandert). Dann drängen sich auf dem Streudiagramm alle Items auf die rechte Seite (Hochzufriedenheitsseite), und die Teilung der horizontalen Achse funktioniert nicht. Alles landet im „Erhaltungsbereich" — und nichts wird entschieden.

Gegenmaßnahmen

Am Median teilen: Robuster gegenüber einer schiefen Verteilung als der Mittelwert. Auch bei einer Häufung rechts lassen sich die Items zweiteilen
Die Zufriedenheit standardisieren (z-Standardisierung): Jedes Item vor dem Abtragen in seine „relative Position innerhalb aller Items" umrechnen. So lässt man sich nicht von der absoluten Höhe ziehen und sieht die relativen Unterschiede zwischen den Items
Statt der Zufriedenheit die „Unzufriedenheitsrate" oder die „Differenz zur Top-Box" verwenden: So vergrößert man die kleinen Unterschiede im Hochwertbereich

Den Deckeneffekt zu ignorieren und „alle Items liegen oben rechts, also ist unser Unternehmen auf der sicheren Seite" zu lesen, ist die typischste Fehlinterpretation der IPA. Sobald Sie das Streudiagramm erstellt haben, zweifeln Sie zuerst daran, ob sich die Punkte zu einem Klumpen ballen.

6. Verbesserte IPA — der Diagonal-Ansatz und die „Asymmetrie der Zufriedenheit"

An den klassischen vier Quadranten gibt es auch Kritik, und mehrere Verbesserungen wurden vorgeschlagen. In der Praxis lohnt es sich, die folgenden zwei zu kennen.

Diagonal-Ansatz (Bacon 2003)

Statt am Mittelwert von vertikal und horizontal zu teilen, zieht man die 45-Grad-Linie „Wichtigkeit = Zufriedenheit" und misst die Priorität über die Distanz zu dieser Linie. Bacon (2003) wies darauf hin, dass die Vier-Quadranten-Einteilung instabil wird, wenn sich Attribute nahe der Quadrantengrenze sammeln, und zeigte, dass es robuster ist, die Priorität kontinuierlich über die Abweichung von der Diagonalen (das Maß, um das die Wichtigkeit die Zufriedenheit übersteigt) zu bewerten. Der Vorteil: Man umgeht die Entweder-oder-Entscheidung „in welchem Quadranten liegt es".

Asymmetrie der Zufriedenheit — die Verbindung von IPA und Kano (Matzler 2004)

Die klassische IPA nimmt an, „die Wichtigkeit ist ein von der Zufriedenheit unabhängiger fester Wert"; Matzler et al. (2004) zeigten jedoch, dass die Wichtigkeit eines Attributs sich mit dem Niveau der Zufriedenheit ändert (asymmetrisch, nichtlinear).

Basismerkmal (Must-be): Selbstverständlich vorhanden. Ist es erfüllt, steigt die Zufriedenheit nicht, fehlt es aber, entsteht starke Unzufriedenheit (Beispiel: Login funktioniert, Abrechnung ist korrekt)
Begeisterungsmerkmal (Attractive): Fehlt es, gibt es keine Unzufriedenheit, ist es da, springt die Zufriedenheit nach oben (Beispiel: unerwartet vorausschauender Support)

Mit anderen Worten: „Die Wichtigkeit für unzufriedene Kunden" und „die Wichtigkeit für zufriedene Kunden" sind zweierlei. Berechnet man die abgeleitete Wichtigkeit getrennt für die Gruppe mit hoher und die mit niedriger Zufriedenheit, lassen sich Basismerkmal und Begeisterungsmerkmal voneinander trennen. Ob ein Item „im vorrangigen Verbesserungsbereich liegt, aber eigentlich ein Basismerkmal ist (eine Verbesserung hebt die Zufriedenheit nicht, sondern beseitigt nur Unzufriedenheit)" oder ein „Begeisterungsmerkmal (eine Verbesserung lässt die Zufriedenheit nach oben springen)" — davon hängt die Bedeutung der Investition ab.

7. Der Blick der Redaktion — 5 Dinge, die man bei der IPA nicht tun darf

Aus der Position, Branchenfälle und Stimmen aus der Praxis fortlaufend zu verfolgen, hier fünf Pannen, die bei der IPA immer wieder passieren. Bei allen war nicht „die Analyse falsch", sondern „das Lesen daneben".

1. Die Wichtigkeit aus der direkten Frage für bare Münze nehmen

Die häufigste Panne. „Als wir die Wichtigkeit erfragt haben, war alles bei 4,2" — und die vertikale Achse kollabiert. Dreht man die IPA nur mit der direkten Frage, scheitert sie fast sicher am Deckeneffekt. Ziehen Sie immer auch die abgeleitete Wichtigkeit (Korrelation mit der Gesamtzufriedenheit) heran. Wenn nur eines möglich ist, wählen Sie die Ableitung.

2. Den Deckeneffekt der Zufriedenheit ignorieren und sich bei „alles oben rechts" beruhigen

Sobald Sie das Streudiagramm erstellt haben, schauen Sie zuerst, ob sich die Punkte zu einem Klumpen ballen. Bei einer Häufung rechts probieren Sie die Median-Teilung oder die z-Standardisierung. Eine IPA, bei der „alle Items im Erhaltungsbereich" liegen, übersieht fast sicher den Deckeneffekt.

3. Die Instabilität der Mittelwert-Teilung nicht verstehen und die Schlussfolgerung jeden Monat schwanken lassen

Jedes Mal, wenn man Items hinzufügt oder abzieht, verschiebt sich die Trennlinie, und der Quadrant ändert sich ohne Bezug zu Maßnahmen. Fixieren Sie das Item-Set und vermerken Sie unbedingt den Wert der Trennlinie. Wer im Zeitverlauf verfolgt, muss auch die Lage der Linie mit aufzeichnen, sonst ist der Vormonatsvergleich bedeutungslos.

4. „Überzogene Qualität" mit einer Stärke verwechseln und weiter verteidigen

Man hält ein Item mit niedriger Wichtigkeit × hoher Zufriedenheit für „unsere Stärke", steckt weiter Ressourcen hinein und kommt nicht zum vorrangigen Verbesserungsbereich. Der Bereich überzogener Qualität ist nicht etwas, womit man sich brüstet, sondern ein Kandidat für die Umverteilung. Allerdings sollte man einmal aus dem Blickwinkel der Asymmetrie (ist es ein Basismerkmal?) prüfen, ob die „niedrige Wichtigkeit" nicht nur vorübergehend ist.

5. Quadranten anhand der Zufriedenheit von Attributen mit kleinem N festlegen

Bei einem Design, in dem je Attribut „nur die Betroffenen" antworten (Beispiel: die Support-Zufriedenheit nur Support-Nutzer), variiert das N je nach Attribut stark. Den Quadranten anhand des mittleren Zufriedenheitswerts eines Attributs mit N=15 festzulegen und „das ist vorrangig zu verbessern" zu handeln, ist riskant. Geben Sie das N je Attribut immer mit an und halten Sie das Urteil bei Attributen mit kleinem N zurück. Den Umgang mit der Stichprobengröße finden Sie unter Wie man die nötige Stichprobengröße bestimmt.

8. IPA-Betrieb mit dem Umfragetool Kicue

Die IPA teilt sich in eine Phase, in der man „mit Fragen Zufriedenheit und Wichtigkeit misst", und eine Analysephase, in der man „das ins Streudiagramm überträgt und in vier Quadranten liest". Kicue übernimmt die erste; die zweite ist eine Kombination mit externen Werkzeugen.

Messung von Zufriedenheit und expliziter Wichtigkeit: Unterstützt das Fragendesign, das je Attribut die Zufriedenheit und die „Wichtigkeit" auf einer 5- oder 7-stufigen Likert-Skala misst (Fragetypen · Designleitfaden für die Likert-Skala)
Mitführen einer Frage zur Gesamtzufriedenheit: Die für die Berechnung der abgeleiteten Wichtigkeit nötigen Fragen „Gesamtzufriedenheit" und „Wiederkaufabsicht" lassen sich im selben Formular platzieren
CSV-Export mit Befragten-ID: Gibt die attributbezogene Zufriedenheit und die Gesamtzufriedenheit in der Struktur „eine Zeile pro Antwort" aus. Nutzbar für die Korrelationsberechnung der abgeleiteten Wichtigkeit und die Aufteilung in Gruppen hoher und niedriger Zufriedenheit
GT-Auswertung · Kreuztabellierung: Bis zur Prüfung von Mittelwert und Verteilung je Attribut ist es im Dashboard möglich

⚠️ Was Kicue nicht leisten kann

Kein Erstellen des IPA-Streudiagramms und keine Vier-Quadranten-Darstellung: Ein Betrieb, bei dem man das CSV exportiert und in Excel (Streudiagramm) / R / Python / SPSS / JASP zeichnet und die Quadranten teilt
Keine Funktion zur Berechnung der abgeleiteten Wichtigkeit (Korrelation, Regression): Die statistische Analyse erfolgt in externen Werkzeugen. Kicue selbst hat keine Funktionen zur statistischen Analyse
Auch keine z-Standardisierung oder Median-Teilung als Vorverarbeitung: All das erfolgt nach dem Export in der Tabellenkalkulation / Statistiksoftware

Liest man als verwandte Beiträge den Designleitfaden für die Kundenzufriedenheit (CSAT), den Leitfaden zur Auswahl der CX-Metriken, den Leitfaden zur Umfrageauswertung und Signifikanzprüfung, den Leitfaden zur Visualisierung von Umfrageergebnissen und den Leitfaden zum Design eines VoC-Programms mit, wird die Abfolge „Zufriedenheit messen → Verbesserungspriorität festlegen → in den Betrieb überführen" sichtbar.

Zusammenfassung — 6 Punkte, um die IPA für Entscheidungen zu nutzen

Faktisch schaut man nur auf den „vorrangigen Verbesserungsbereich" — die 2-3 Items mit hoher Wichtigkeit × niedriger Zufriedenheit sind das nächste Verbesserungsthema
Niedriger Wert ≠ Priorität — betrachten Sie immer auch die Achse der Wichtigkeit. Unterdrücken Sie den Drang, den Bereich niedriger Priorität reparieren zu wollen
Wichtigkeit: Ableitung (Korrelation) als Haupt-, direkte Frage als Nebenquelle — die direkte Frage allein scheitert fast immer am Deckeneffekt
Den Deckeneffekt der Zufriedenheit bezweifeln — ballt sich das Streudiagramm rechts, dann Median-Teilung oder z-Standardisierung
Bei der Mittelwert-Teilung das Item-Set fixieren und die Lage der Linie vermerken — sonst wird der Vormonatsvergleich bedeutungslos
Das N je Attribut mit angeben und das Urteil bei kleinem N zurückhalten — bei Attributen, die nur Betroffene beantworten, splittet das N

Die IPA ist nicht „schwierig, weil die Analyse anspruchsvoll ist". Wenn Sie die beiden Punkte — wie man die Wichtigkeit misst und die Schiefe der Zufriedenheitsdaten — nicht verfehlen, ist sie ein Rahmen mit hohem Kosten-Nutzen-Verhältnis, der die Entscheidung im Vorstand mit einem einzigen Excel-Streudiagramm voranbringt.

Wer eine Befragung zur Messung von Zufriedenheit und Wichtigkeit gestalten möchte, sollte das kostenlose Umfragetool Kicue ausprobieren. Vom Likert-Fragendesign für attributbezogene und Gesamtzufriedenheit über den CSV-Export mit Befragten-ID bis hin zur GT- und Kreuztabellierung lässt sich der Teil, der die Eingabedaten für die IPA erzeugt, mit einem Konto starten (das Erstellen des Streudiagramms, die Korrelationsberechnung der abgeleiteten Wichtigkeit und die z-Standardisierung erfolgen in Kombination mit Excel / R / Python / SPSS / JASP).

Literatur

Martilla, J. A., & James, J. C. (1977). Importance-Performance Analysis. Journal of Marketing, 41(1), 77-79.
Bacon, D. R. (2003). A Comparison of Approaches to Importance-Performance Analysis. International Journal of Market Research, 45(1), 55-71.
Matzler, K., Bailom, F., Hinterhuber, H. H., Renzl, B., & Pichler, J. (2004). The asymmetric relationship between attribute-level performance and overall customer satisfaction: a reconsideration of the importance–performance analysis. Industrial Marketing Management, 33(4), 271-277.
Oh, H. (2001). Revisiting importance-performance analysis. Tourism Management, 22(6), 617-627.
Azzopardi, E., & Nash, R. (2013). A critical evaluation of importance–performance analysis. Tourism Management, 35, 222-233.