Die Wahrscheinlichkeit, Ihre Daten (oder etwas Extremeres) zu beobachten, wenn es tatsächlich keinen Effekt gäbe. Weit verbreitet, weit verbreitet missverstanden und niemals allein ausreichend für eine Entscheidung.
Definition: Die Wahrscheinlichkeit, Ihre Daten (oder etwas Extremeres) zu beobachten, wenn es tatsächlich keinen Effekt gäbe. Weit verbreitet, weit verbreitet missverstanden und niemals allein ausreichend für eine Entscheidung.
Ein p-Wert gibt an, wie wahrscheinlich Ihr beobachtetes Ergebnis wäre, wenn die Nullhypothese wahr wäre, also wenn es keinen realen Unterschied oder Effekt gäbe. Ein kleiner p-Wert bedeutet, dass die Daten unter der Annahme keines Effekts überraschend wären.
Wenn p = 0,03, besteht eine 3%ige Wahrscheinlichkeit, ein so extremes Ergebnis zu sehen, unter der Annahme, dass die Nullhypothese wahr ist. Es bedeutet nicht:
Der Schwellenwert von 0,05 ist eine Konvention, kein Naturgesetz. Fisher schlug ihn ursprünglich als grobe Orientierung vor, nicht als binäre Entscheidungsregel.
Berichten Sie die Effektstärke zusammen mit Ihrem p-Wert. Ein statistisch signifikantes Ergebnis mit winziger Effektstärke lohnt kein Handeln. Ein nicht-signifikantes Ergebnis mit großer Effektstärke kann eine größere Studie rechtfertigen. Verwenden Sie Konfidenzintervalle, um den Bereich plausibler Werte zu kommunizieren. Das ist deutlich informativer als ein einzelner Ja-oder-Nein-Schwellenwert.
Die Feststellung, dass ein beobachtetes Ergebnis wahrscheinlich nicht allein durch Zufall entstanden ist. Konventionell angezeigt durch einen p-Wert unter 0,05, was einer Wahrscheinlichkeit von weniger als 5 % entspricht, dass das Ergebnis ein Zufallsbefund ist.
Ein Maß für die Größenordnung eines Befunds: wie groß der Unterschied zwischen Bedingungen ist, nicht nur ob er existiert. Unverzichtbar, um die praktische Bedeutsamkeit jenseits der statistischen Signifikanz zu bestimmen.
Die Anzahl der Teilnehmer*innen in einer Forschungsstudie. Die geeignete Stichprobengröße hängt von den Forschungszielen, der Methodenart (qualitativ vs. quantitativ), der geforderten Präzision und der Anzahl der untersuchten Nutzersegmente ab.
Dieser Begriff wird in den folgenden Artikeln referenziert: