A/B Testing

A/B Testing teilt Ihre Nutzer*innen in zwei Gruppen auf: Eine sieht Version A, die andere Version B. Anschließend wird gemessen, welche Variante bei einer definierten Metrik besser abschneidet. Es ist der Goldstandard für kausale Schlussfolgerungen bei Produktentscheidungen.

Wann einsetzen

Feature-Validierung: Sie haben eine bestimmte Änderung und möchten wissen, ob sie eine Metrik verbessert
Optimierung: Sie haben einen funktionierenden Flow und möchten ihn schrittweise verbessern
Diskussionen beilegen: Stakeholder sind sich uneinig, welches Design besser ist. Lassen Sie die Daten entscheiden

Wann nicht einsetzen

A/B Tests beantworten die Frage "Was ist besser?", aber nicht "Warum?". Wenn Ihre Conversion Rate um 15 % sinkt, zeigt Ihnen ein A/B Test, dass das neue Design die Ursache war. Er verrät Ihnen jedoch nicht, was die Nutzer*innen verwirrt hat. Dafür benötigen Sie qualitative Forschung.

A/B Tests erfordern außerdem ausreichend Traffic. Wenn Ihre Stichprobengröße zu klein ist, erreichen die Ergebnisse keine statistische Signifikanz, und Sie raten letztlich nur mit zusätzlichem Aufwand.

Häufige Fehler

Zu frühes Prüfen der Ergebnisse: Wenn Sie vor Erreichen der geplanten Stichprobengröße auswerten, steigt die Rate falsch-positiver Ergebnisse
Zu viele Varianten testen: Jede zusätzliche Variante erfordert mehr Traffic und erhöht die Komplexität
Effektgröße ignorieren: Ein statistisch signifikantes Ergebnis mit winziger Effektgröße lohnt sich nicht auszuliefern

Wann einsetzen

Feature-Validierung: Sie haben eine bestimmte Änderung und möchten wissen, ob sie eine Metrik verbessert
Optimierung: Sie haben einen funktionierenden Flow und möchten ihn schrittweise verbessern
Diskussionen beilegen: Stakeholder sind sich uneinig, welches Design besser ist. Lassen Sie die Daten entscheiden

Wann nicht einsetzen

Häufige Fehler

Zu frühes Prüfen der Ergebnisse: Wenn Sie vor Erreichen der geplanten Stichprobengröße auswerten, steigt die Rate falsch-positiver Ergebnisse
Zu viele Varianten testen: Jede zusätzliche Variante erfordert mehr Traffic und erhöht die Komplexität
Effektgröße ignorieren: Ein statistisch signifikantes Ergebnis mit winziger Effektgröße lohnt sich nicht auszuliefern

A/B Testing

Wann einsetzen

Wann nicht einsetzen

Häufige Fehler

Verwandte Begriffe

Conversion Rate

Statistische Signifikanz

Stichprobengröße

Erwähnungen im Knowledge Hub

Stichproben-Rechner: Tool und Erklärungen

Research-Timing und Teamfundament: Wann forschen und wer forscht

Der Business Case für UX Research

Research-Disziplinen: Eine Karte für Praktiker*innen

Qualitative und quantitative Forschung: Eine falsche Dichotomie

Aktive vs. Passive Datenerhebung

Kostenloses Buch

A/B Testing

Wann einsetzen

Wann nicht einsetzen

Häufige Fehler

Verwandte Begriffe

Conversion Rate

Statistische Signifikanz

Stichprobengröße

Erwähnungen im Knowledge Hub

Stichproben-Rechner: Tool und Erklärungen

Research-Timing und Teamfundament: Wann forschen und wer forscht

Der Business Case für UX Research

Research-Disziplinen: Eine Karte für Praktiker*innen

Qualitative und quantitative Forschung: Eine falsche Dichotomie

Aktive vs. Passive Datenerhebung