WHATSAPP / TELEGRAM / TELEFON: +49 176 57 95 85 04 I GHOSTWRITING. MIT WERTEN. I E-MAIL: INFO@DER-ABSCHLUSSHELFER.DE

Statistik-Know-how Teil 3

Erzengel Amin in Aktion!

"Ich selbst merke nach fünf Jahren auf dem Ghostwriting-Markt, dass nirgends wirklich die Intention besteht, zu helfen. Jede Website und jeder Text, den ich online finden konnte, war für den Umsatz optimiert. Im dritten Teil der Statistik-Know-how-Reihe will ich das umkehren, so wie es ohnehin die Idee von Die Abschlusshelfer ist. Hier werde ich anhand eines realistischen wissenschaftlichen Projektes Statistik vorführen, und zwar mittels R & SPSS. Den Datensatz stelle ich ebenfalls zur Verfügung, damit Ihr direkt üben könnt!"

Amin Rafiki

280+

1,3 -Schnitt

Bei Statistikarbeiten

Statistikprojekte begleitet

Danke sagen

6. Skalenniveaus verstehen

Skalenniveaus beantworten eigentlich nur eine einfache Frage: Wie wurden Daten gemessen? Und genau davon hängt später ab, welche statistischen Verfahren überhaupt sinnvoll sind.

Bei einer Nominalskala werden Werte lediglich verschiedenen Kategorien zugeordnet. Geschlecht, Studiengang oder Wohnort wären typische Beispiele. Die Reihenfolge spielt keine Rolle. BWL ist nicht „mehr“ als Psychologie und Berlin nicht „größer“ als Köln. Hier werden häufig Häufigkeiten oder Chi-Quadrat-Tests genutzt.

Die Ordinalskala besitzt zusätzlich eine Reihenfolge. Zufriedenheit auf einer Skala von 1 bis 5 wäre ein klassisches Beispiel. Eine Person mit einer 5 ist zufriedener als jemand mit einer 2. Wie groß dieser Unterschied wirklich ist, bleibt allerdings offen.

Die Intervallskala besitzt gleiche Abstände zwischen Werten. Temperatur in Celsius wird häufig genannt. Der Unterschied zwischen 10 °C und 20 °C entspricht dem Unterschied zwischen 20 °C und 30 °C. Ein echter Nullpunkt fehlt jedoch.

Die Verhältnisskala enthält zusätzlich einen natürlichen Nullpunkt. Alter, Einkommen, Gewicht oder Schlafdauer gehören dazu. 0 Stunden Schlaf bedeutet tatsächlich kein Schlaf. Genau deshalb lassen sich hier deutlich mehr Berechnungen durchführen.

Übrigens schreibe ich manchmal auch in online Live-Sessions ausgewählte Hausarbeiten, während Ihr Eure Fragen stellen könnt.

Informiere Dich:

Whatsapp (Amin)

7. Deskriptive Statistik: Ein Abriss

Wenn SPSS oder R zum ersten Mal Ergebnisse ausgeben, erscheinen häufig Werte wie diese:

M = 3,84; SD = 0,92; Min = 1; Max = 5

Wenn Ihr das statistische Denken nicht gewohnt seid, schaut Ihr oft ungefähr so wie auf einen IKEA-Aufbauplan ohne Bilder. Hier müsst Ihr verstehen, dass diese Zahlen zunächst nur beschreiben, wie die Daten aussehen. Mehr nicht. Nehmen wir als Beispiel eine Befragung zur Prüfungsangst. Bevor untersucht wird, ob Neurotizismus, Stress oder Schlaf damit zusammenhängen, wird häufig zuerst beschrieben:

Wie hoch war die durchschnittliche Prüfungsangst?
Wie stark unterscheiden sich Antworten?
Wie alt waren Teilnehmende?
Gab es extreme Werte?

Ein Ergebnisteil könnte dann lauten:

Die Prüfungsangst der Stichprobe lag im Mittel bei 3,8 Punkten (SD = 0,9). Das Alter variierte zwischen 19 und 34 Jahren.

Nicht so tolles Feedback vom Betreuer bekommen?

Bei mir kannst Du Dich ausheulen:

Stramme Schulter

8. Daten visualisieren

Irgendwann kommt fast jede empirische Arbeit an den Punkt, an dem Zahlen nicht mehr nur beschrieben, sondern dargestellt werden sollen. Genau dann tauchen Diagramme auf. Die Darstellung von Daten hat einen simplen Zweck: Ergebnisse schneller verständlich machen.

Balkendiagramme eignen sich häufig für Gruppenvergleiche. Beispielsweise unterschiedliche Stresswerte zwischen Studiengängen.

Kreisdiagramme zeigen Anteile, etwa Geschlechterverteilungen. Werden oft genutzt. Nicht immer sinnvoll.

Histogramme helfen dabei zu erkennen, wie Werte verteilt sind. Gerade bei Normalverteilungen relevant.

Boxplots zeigen Streuungen, Medianwerte und mögliche Ausreißer. Viele ignorieren sie, obwohl sie oft schneller Probleme sichtbar machen als Tabellen.

Tabellen bleiben dennoch Standard in Ergebnisteilen, weil sie präziser sind als Grafiken.

Mein Tipp ist, dass Ihr Euch folgendes merkt: Eine gute Darstellung beantwortet im Idealfall sofort eine Frage. Schlechte Darstellungen erzeugen neue. Eure Betreuer erkennen an Diagrammen ziemlich schnell, ob Ihr Eure eigenen Daten verstanden habt oder nicht.

Rom wurde volkstümlich nicht an einem Tag erbaut.

Ich und mein Team können jedoch gar eine Mustervorlage für eine Bachelorarbeit in kürzester qualitativ hochwertig erstellen.

Informieren

9. Hypothesen testen: Der Punkt, an dem viele anfangen, Statistik unnötig kompliziert zu finden

Spätestens hier tauchen Begriffe auf, die bei den meisten von uns ungefähr dieselbe Reaktion auslösen: Nullhypothese, Signifikanzniveau, p-Wert. Klingt zunächst kompliziert, verfolgt am Ende aber eine relativ einfache Idee. Fast jede empirische Arbeit versucht irgendwann eine Annahme zu prüfen. Angenommen die Forschungsfrage lautet: „Besteht ein Zusammenhang zwischen Stress und Prüfungsangst bei Studierenden?“

Dann entstehen im Hintergrund häufig zwei gegensätzliche Annahmen. Die Nullhypothese (H₀) behauptet zunächst, dass kein Zusammenhang existiert. Die Alternativhypothese (H₁) geht davon aus, dass ein Zusammenhang besteht. Statistik versucht anschließend nicht zu beweisen, dass die Alternativhypothese wahr ist. Stattdessen wird geprüft, wie plausibel die Nullhypothese anhand der Daten noch wirkt.

Genau hier erscheint später normalerweise der p-Wert. Wenn tatsächlich kein Zusammenhang bestehen würde, wären die beobachteten Daten eher unwahrscheinlich. Das heißt aber nicht, dass etwas bewiesen wurde und auch nicht automatisch, dass ein Ergebnis praktisch relevant ist. Ein kleines Beispiel macht das hoffentlich greifbarer. Stellen wir uns vor, untersucht werden Unterschiede in der Prüfungsangst zwischen Studierenden mit Nebenjob und ohne Nebenjob. Nach der Analyse ergibt sich: p = 0,018. Da dieser Wert kleiner als 0,05 ist, würde die Nullhypothese häufig verworfen werden. Die Daten sprechen eher dafür, dass Unterschiede bestehen könnten. Ein Ergebnissatz könnte dann lauten:

„Studierende mit Nebenjob zeigten signifikant höhere Prüfungsangst als Studierende ohne Nebenjob (p = .018).“

Das klingt zunächst eindeutig. Es fehlt jedoch eine weitere Frage:

Wie groß ist dieser Unterschied überhaupt?

Wenn sich die Mittelwerte nur minimal unterscheiden, kann ein Ergebnis statistisch signifikant sein, praktisch aber kaum Bedeutung besitzen. Genau deshalb werden häufig zusätzlich Effektgrößen betrachtet.

Ein stark anonymisierter Fall aus meinem Alltag sei hierfür exemplarisch herangezogen. Die Forschungsfrage lautete sinngemäß: „Beeinflusst die tägliche Social-Media-Nutzung depressive Symptome bei Studierenden?“

Kurz zum Setting: Eigene Datenerhebung, etwa 160 Teilnehmende, mehrere Skalen. Die Fragestellung war per se klar. Die Auswertung ignorierte das aber leider. Enthalten waren unter anderem mehrere t-Tests zwischen Altersgruppen, eine ANOVA nach Studienfach, zusätzliche Signifikanztests zwischen Schlafdauer und Geschlecht sowie Korrelationen zu Variablen, die in der eigentlichen Forschungsfrage nie vorkamen. Zusätzlich wurde ein p-Wert von 0,047 im Ergebnisteil so behandelt, als wäre damit die komplette Forschungsfrage beantwortet.

Doch was fast komplett ignoriert wurde, war, welche Hypothese überhaupt beantwortet werden sollte? Die Forschungsfrage zielte ja klar auf einen möglichen Zusammenhang zwischen Social-Media-Nutzung und depressiven Symptomen ab. Sinnvoll wäre also ungefähr folgende Reihenfolge gewesen:

Zunächst Daten beschreiben, anschließend Reliabilität der Skalen prüfen, danach Zusammenhänge untersuchen und gegebenenfalls über eine Regression genauer betrachten, wie stark Social-Media-Nutzung depressive Symptome vorhersagen kann.

Im Rahmen von Coaching-Sessions kann ich Dich von Anfang bis Ende begleiten. Ob Statistik oder wissenschaftliches Arbeiten.

Ich bin nur einen Klick entfernt:

Anfragen

10. Korrelationen verstehen

Korrelationen tauchen in empirischen Arbeiten häufig auf, weil viele Forschungsfragen am Anfang erstaunlich unspektakulär sind. Es geht oft nicht darum, etwas zu beweisen, sondern zunächst nur herauszufinden, ob zwei Dinge überhaupt gemeinsam auftreten. Besteht ein Zusammenhang zwischen Stress und Schlafqualität? Hängt Neurotizismus mit Prüfungsangst zusammen? Geht hohe Arbeitsbelastung mit geringerer Zufriedenheit einher? Solche Fragen landen relativ schnell bei Korrelationen. Die Berechnung selbst ist heute selten die Schwierigkeit. SPSS erledigt das in Sekunden. Anspruchsvoller wird meist die Interpretation danach.

Ein Korrelationswert bewegt sich typischerweise zwischen -1 und +1. Positive Werte sprechen eher dafür, dass zwei Variablen gemeinsam steigen. Negative Werte deuten eher darauf hin, dass mit zunehmender Ausprägung der einen Variable die andere sinkt. Werte nahe 0 zeigen häufig keinen erkennbaren linearen Zusammenhang. Ein Ergebnis von r = 0,62 wirkt zunächst stärker als r = 0,18, sagt aber noch nichts darüber aus, warum dieser Zusammenhang existiert. Genau an dieser Stelle entsteht in Ergebnisteilen regelmäßig ein Bruch zwischen Daten und Interpretation. Aus „Stress und Schlaf hängen zusammen“ wird plötzlich „Stress verschlechtert Schlaf“. Aus „Arbeitszufriedenheit korreliert mit Burnout“ entsteht „Unzufriedenheit verursacht Burnout“. Die Formulierungen wirken klein, verändern die Aussage jedoch vollständig.

Wenn eine Untersuchung beispielsweise zeigt, dass höhere Lernzeiten mit besseren Noten einhergehen, klingt die schnelle Schlussfolgerung nachvollziehbar: Mehr Lernen verbessert Leistungen. Vielleicht stimmt das sogar. Vielleicht lernen leistungsstarke Personen aber grundsätzlich strukturierter. Vielleicht schlafen sie besser oder besitzen andere Voraussetzungen. Vielleicht existieren mehrere Einflüsse gleichzeitig. Eine Korrelation trennt diese Dinge nicht sauber voneinander. Sie zeigt zunächst nur Muster. Und Muster sind noch keine Ursachen.

Bei Interesse kannst Du auch einfach mal in unserem Online-Shop stöbern

Hier geht es zum Shop:

Zum Online-Shop

11. Gruppen vergleichen (t-Test und ANOVA)

Bis hierhin ging es häufig um Zusammenhänge. Also Fragen wie: „Steigt Variable A gemeinsam mit Variable B?“ Irgendwann ändern sich Forschungsfragen jedoch leicht und plötzlich lautet die Überlegung nicht mehr, ob etwas zusammenhängt, sondern ob sich Gruppen unterscheiden.

Die Formulierungen klingen dann ungefähr so:

Unterscheiden sich Männer und Frauen hinsichtlich ihrer Prüfungsangst?
Unterscheiden sich Personen im Homeoffice von Personen im Büro hinsichtlich ihrer Arbeitszufriedenheit?
Gibt es Unterschiede zwischen Studierenden verschiedener Studiengänge?

Nehmen wir eine Untersuchung zur Prüfungsangst. Angenommen, eine Gruppe von Studierenden arbeitet neben dem Studium mehr als 20 Stunden pro Woche und eine zweite Gruppe arbeitet gar nicht. Nun soll geprüft werden, ob sich beide Gruppen hinsichtlich ihrer Prüfungsangst unterscheiden. Die Daten könnten später ungefähr zeigen:

Gruppe ohne Nebenjob: Mittelwert = 2,8
Gruppe mit Nebenjob: Mittelwert = 3,7

Die Mittelwerte unterscheiden sich sichtbar. Reicht das bereits aus, um von einem echten Unterschied zu sprechen? Die Antwort ist not really. Denn Unterschiede entstehen manchmal auch zufällig. Genau deshalb taucht hier häufig der t-Test auf. Er prüft vereinfacht, ob sich zwei Gruppen statistisch voneinander unterscheiden oder ob beobachtete Unterschiede eher zufällig wirken könnten. Ein Ergebnis könnte beispielsweise ergeben: p = 0,012. Dann würde häufig angenommen, dass sich die Gruppen unterscheiden. Viele Studierende stoppen an dieser Stelle. In der Praxis folgt jedoch noch eine zweite Frage: Wie groß ist dieser Unterschied überhaupt?

Noch interessanter wird es, wenn nicht zwei Gruppen verglichen werden, sondern mehrere. Angenommen untersucht wird: Unterscheiden sich Studierende aus Psychologie, BWL und Medizin hinsichtlich ihres Stressempfindens? Jetzt existieren nicht mehr zwei Gruppen, sondern drei. An dieser Stelle erscheint häufig die ANOVA (Varianzanalyse).

Die ANOVA prüft zunächst nur: Gibt es irgendwo zwischen den Gruppen Unterschiede? Sie beantwortet nicht automatisch: Zwischen welchen Gruppen genau? Wenn eine ANOVA signifikant ausfällt, folgen häufig zusätzliche Tests, um die Unterschiede genauer einzugrenzen. Gerade hier entstehen viele Fehler, weil zumeist aus fehlendem Verständnis Verfahren gewählt werden, die zur Forschungsfrage gar nicht passen. Es gilt:

Wenn zwei Gruppen verglichen werden sollen, ist eine ANOVA häufig unnötig kompliziert.

Wenn mehrere Gruppen betrachtet werden, reicht ein einfacher t-Test meist nicht mehr.

Und wenn eigentlich Zusammenhänge untersucht werden sollen, wären beide Verfahren unpassend.

Solltest Du unverändert Hilfe brauchen, ist jetzt der perfekte Zeitpunkt, Dich zu melden.

Anfragen

Kontakt

Direkter Kontakt

📧 info@der-abschlusshelfer.de

📞 +49 176 57 95 85 04 (Whatsapp, Telegram)

Rechtliches

Über UNS

Die Abschlusshelfer

Die Abschlusshelfer

Unsere Philosophie

Aroser Allee 159

13407 Berlin, DE

AGB