Ein Maß für die Größenordnung eines Befunds: wie groß der Unterschied zwischen Bedingungen ist, nicht nur ob er existiert. Unverzichtbar, um die praktische Bedeutsamkeit jenseits der statistischen Signifikanz zu bestimmen.
Definition: Ein Maß für die Größenordnung eines Befunds: wie groß der Unterschied zwischen Bedingungen ist, nicht nur ob er existiert. Unverzichtbar, um die praktische Bedeutsamkeit jenseits der statistischen Signifikanz zu bestimmen.
Die Effektgröße quantifiziert die Größenordnung eines Befunds: wie viel besser eine Version im Vergleich zu einer anderen ist, nicht nur ob ein Unterschied besteht.
Statistische Signifikanz sagt Ihnen, dass ein Unterschied wahrscheinlich real ist. Die Effektgröße sagt Ihnen, ob er groß genug ist, um relevant zu sein.
Eine Studie könnte einen statistisch signifikanten Unterschied finden, der zu klein ist, um die Implementierungskosten zu rechtfertigen. Umgekehrt könnte ein praktisch bedeutsamer Unterschied in einer kleinen Stichprobe keine statistische Signifikanz erreichen. Sie benötigen beide Informationen.
Rohe Differenz: Die tatsächlichen Maßeinheiten (z. B. "12,5 SUS-Punkte höher")
Cohens d: Ein standardisiertes Maß, das den Unterschied in Standardabweichungen ausdrückt:
Standardisierte Effektgrößen ermöglichen Vergleiche über verschiedene Skalen und Studien hinweg.
Geben Sie beim Berichten von Ergebnissen immer beides an:
Diese Praxis ist zentral für die Erzeugung von Impact. Sie geht über einen einfachen p-Wert hinaus und zeigt Stakeholdern, ob ein Unterschied die Entwicklungskosten rechtfertigt.
Die Feststellung, dass ein beobachtetes Ergebnis wahrscheinlich nicht allein durch Zufall entstanden ist. Konventionell angezeigt durch einen p-Wert unter 0,05, was einer Wahrscheinlichkeit von weniger als 5 % entspricht, dass das Ergebnis ein Zufallsbefund ist.
Die Wahrscheinlichkeit, Ihre Daten (oder etwas Extremeres) zu beobachten, wenn es tatsächlich keinen Effekt gäbe. Weit verbreitet, weit verbreitet missverstanden und niemals allein ausreichend für eine Entscheidung.
Forschung mit Fokus auf numerischer Messung und dem Ziel, Ergebnisse von einer Stichprobe auf eine breitere Population zu generalisieren. Beantwortet ‚wie viel', ‚wie viele' und ‚wie oft'.
Dieser Begriff wird in den folgenden Artikeln referenziert:
Validität ist nicht eine Sache. Es ist eine Familie von Konzepten, die jeweils eine andere Art adressieren, wie Forschung schiefgehen kann. Ein umfassender Leitfaden zu Studiendesign-Validität, Messvalidität, qualitativer Vertrauenswürdigkeit und modernen integrierten Frameworks.
Ein interaktiver Stichprobenrechner für UX Research, mit den statistischen Grundlagen erklärt: von binomialer Problemerkennung bis Power-Analyse.
Die wirkungsvollsten Insights stammen selten aus einer einzelnen Quelle. Sie entstehen aus der strategischen Partnerschaft zwischen UX Research und Data Science, die tiefes kontextuelles Verständnis mit Mustern verbindet, die im großen Maßstab identifiziert werden.