GHOSTWRITING. MIT WERTEN.

Statistik-Know-how Teil 1

Der gelbe Engel der Statistik

"Ich kann mich noch sehr gut daran erinnern, dass ich damals für das Modul Statistik lernen musste mit R zu arbeiten. Das war damals einer der härtesten Module des Studiengangs und ich habe über Wochen hinweg täglich 4-5 Stunden dafür gelernt. Ich glaube, ich war nie stolzer auf eine 1,3 als bei diesem Modul."

Amin Rafiki

280+

1,3 -Schnitt

Bei Statistikarbeiten

Statistikprojekte begleitet

Kontakt

1. Ein Versuch, Statistik verständlich zu erklären

Wer im Studium zum ersten Mal Wörter wie p-Wert, Regression, Signifikanzniveau oder Varianz hört, denkt sich erfahrungsgemäß eines von zwei Dingen:

1. „Hä?“, oder:
2. „Und wieder so ein blödes Stress-Modul.“

Viele von uns verbinden Statistik mit komplizierten Formeln, schlaflosen Nächten und der altbekannten Mathephobie. Dabei muss einmal offen gesagt werden: Heutzutage ist Statistik dank Programmen wie SPSS, R, Python oder KI-gestützten Tools längst nicht mehr das Mathe-Monster, das frühere Generationen noch bezwingen mussten wie Siegfried seinen Drachen.

Wir modernen Studierenden profitieren davon, dass dieser Drache längst gefallen ist und sein wundersames Blut tief in Statistiksoftwares eingesickert ist. Vieles, was früher mühselig von Hand berechnet wurde, erledigen Programme heute innerhalb weniger Sekunden.

Statistik hat, nun wo ein großer Teil der Mathematik aus der praktischen Anwendung verschwunden ist, deutlich mehr mit Logik, Verständnis und dem kritischen Hinterfragen von Zusammenhängen zu tun.

Wir fragen uns beispielsweise:

Haben Menschen mit mehr Schlaf bessere Noten?
Gibt es einen Zusammenhang zwischen Arbeitszufriedenheit und Stress?
Sind Personen im Homeoffice zufriedener als Personen im Büro?
Hängt Sport mit psychischem Wohlbefinden zusammen?
Wirken bestimmte Lernmethoden wirklich besser als andere?

Sobald wir solche Fragen nicht mehr nur aus dem Bauchgefühl beantworten möchten, beginnt Statistik.

Also: Was ist Statistik überhaupt?

Ganz einfach erklärt, versucht Statistik Ordnung in Informationen zu bringen. Sie hilft uns dabei herauszufinden, ob ein beobachteter Zusammenhang tatsächlich existiert oder ob wir gerade nur dem Zufall auf den Leim gehen. Ein kleines Beispiel wäre in etwa:

Stellen wir uns vor, zehn Studierende lernen jede Woche mehr als 20 Stunden und schreiben gute Noten. Die schnelle Schlussfolgerung wäre:

Viel Lernen = gute Noten

Aber vielleicht schlafen diese Personen mehr? Vielleicht haben sie weniger Nebenjobs? Vielleicht besitzen sie bessere Lernstrategien? Statistik zwingt uns gewissermaßen dazu, vorsichtiger zu denken. Und genau deshalb ist Statistik viel weniger trocken, als ihr Ruf vermuten lässt. Sie beschäftigt sich nämlich ständig mit einer zutiefst menschlichen Schwäche - Wir ziehen zu voreilig Schlüsse!

Statistik begegnet uns häufiger, als Du denkst

Die meisten Menschen denken bei Statistik sofort an Hochschulen oder empirische Bachelorarbeiten. Tatsächlich begegnet sie uns aber täglich:

Wettervorhersagen
Wahlprognosen
medizinische Studien
Aktienmärkte
Fußballstatistiken
Social-Media-Algorithmen
Netflix-Empfehlungen
Künstliche Intelligenz

Auch moderne KI basiert auf Mustern, Wahrscheinlichkeiten und riesigen Datenmengen. Ohne Statistik gäbe es vieles nicht, was heute selbstverständlich wirkt. Viel mehr gilt sogar: unsere Welt wird immer datengetriebener. Die Fähigkeit, Informationen kritisch einzuordnen, entwickelt sich dadurch logischerweise langsam zu einer Art neuen Allgemeinbildung.

Warum Statistik im Studium oft so abschreckend wirkt

Viele Studierende lernen Statistik ungefähr nach diesem Muster kennen: erste Vorlesung und erste Formel, kurze Verwirrung und zweite Formel, anschließend eine leichte Panik und irgendwann ein YouTube-Video mit dem Titel „SPSS in 10 Minuten erklärt“. Danach folgt Kaffee und noch ein Video. Irgendwann sitzt man nachts vor einer Tabelle und fragt sich ernsthaft, ob der eigene Bildungsweg an dieser Stelle vielleicht eine unerwartete Wendung nehmen wird?

Statistik besitzt einen ziemlich schlechten Ruf, und viele entwickeln bereits Unbehagen, sobald Begriffe wie Regression, Varianz oder Signifikanzniveau auftauchen. Das ist zugegebenermaßen auch ziemlich nachvollziehbar. Doch die Wahrheit wirkt ist, dass fast jede statistische Auswertung mit ziemlich einfachen Überlegungen beginnt. Etwa: Was möchte ich eigentlich herausfinden und welche Daten brauche ich dafür? Interessiert mich ein Unterschied zwischen Gruppen oder suche ich nach einem Zusammenhang zwischen zwei Dingen? Erst danach wird geschaut, welches Verfahren sinnvoll sein könnte. Programme wie SPSS, R oder Python übernehmen dabei den Groß der Berechnungen. Die eigentliche Herausforderung besteht deswegen weniger im Rechnen selbst als im logischen Denken, im kritischen Hinterfragen und darin, die Ergebnisse sinnvoll einzuordnen.

Muss man gut in Mathe sein?

Die ehrliche Antwort ist klipp und klar: Nein. Natürlich helfen mathematische Grundlagen einem, das sei nicht negiert. Aber für viele empirische Arbeiten sind andere Fähigkeiten viel entscheidender, nämlich:

logisch zu denken
seine eigenen Forschungsfragen wirklich zu verstehen
Zusammenhänge zu erkennen
Ergebnisse sauber darzustellen und zu interpretieren
passende statistische Verfahren auswählen

Wofür braucht man Statistik überhaupt im Studium?

Statistik taucht im Studium in relativ vielen Fachrichtungen auf:

Psychologie
→ Zusammenhänge untersuchen, Hypothesen testen

BWL
→ Marktanalysen, Umfragen, Regressionen

Medizin & Pflegewissenschaften
→ Wirksamkeit von Behandlungen prüfen

Soziale Arbeit & Pädagogik
→ Befragungen auswerten

Gesundheitswissenschaften
→ Risiken analysieren

Ingenieurwissenschaften
→ Prozesse messen und optimieren

Kurz gesagt oder eben als Faustregel formuliert: Wer eine Umfrage erstellt, Daten erhebt oder eine empirische Arbeit schreibt, landet früher oder später bei Statistik.

Unser Ziel mit diesem Bereich

Die wesentliche Frage, die Ihr Euch im Kontext der Statistik stellen solltet, ist in etwa: "Was bedeutet das eigentlich, wann brauche ich es und wie nutze ich es für meine eigene Haus-, Bachelor- oder Masterarbeit?"

Genau aus diesem Grund entsteht dieser Bereich Schritt für Schritt mit dem Anspruch, Statistik verständlicher und greifbarer für Euch zu machen, ohne die Themenbereiche selbst unnötig kompliziert wirken zu lassen. Doch auch hier gilt einmal mehr: Bitte habt Verständnis dafür, dass meine projektbezogene Auslastung mich oftmals vom Optimieren der Website sowie ihrer Inhalte abhält. Ich gebe zweifelsohne mein Bestes, damit Ihr auch hier den größtmöglichen Mehrwert für Euch ziehen könnt, selbst wenn wir nicht zusammenarbeiten und ich die Texte auf der gesamten Seite SEO-bedingt manchmal klobig schreiben muss. (Sorry dafür, aber ich bin der festen Überzeugung, dass jeder Studierende, der zu mir kommt statt zur Konkurrenz zu gehen, eine weitere gerettete Seele ist! Das heißt für mich: SEO! SEO! SEO!)

Hier findet ihr künftig entsprechend Erklärungen zu statistischen Grundlagen, Unterstützung bei SPSS, Einblicke in R und Python für Analysen, Hilfen bei der Wahl passender statistischer Tests sowie ein wachsendes Statistik-Lexikon mit Begriffen, über die viele von Euch zwangsläufig stolpern werden. Hinzu kommen praktische Hilfsmittel, Praxisbeispiele und Musterauswertungen, die während einer wissenschaftlichen Arbeit früher oder später fast immer auftauchen und Euch optimal vorbereiten sollen.

Schon das Gefühl bekommen, Du brauchst Hilfe bei Deiner Statistik?

Dann nicht verzagen und Amin fragen:

Anfragen

2. Ein akademischer Blick auf die Statistik

Im wissenschaftlichen Kontext soll Statistik dabei helfen, Fragen systematisch zu beantworten und Entscheidungen nachvollziehbarer zu machen. Vereinfacht gesagt: Wissenschaft versucht ständig herauszufinden, ob etwas wirklich so ist, und Statistik hilft dabei, zwischen Vermutung, Zufall und tatsächlichem Zusammenhang zu unterscheiden.

Wenn beispielsweise untersucht werden soll, ob Homeoffice die Arbeitszufriedenheit beeinflusst oder ob Schlaf einen Zusammenhang mit Studienleistungen besitzt, reicht die persönliche Einschätzung einzelner Personen kaum aus. Aussagen wie „Ich glaube schon“ oder „Bei mir war das zumindest so“ gehören zwar zum Alltag, reichen für wissenschaftliche Erkenntnisse aber nicht. Wissenschaft möchte prüfen, wie stark ein Zusammenhang tatsächlich ist, ob Unterschiede messbar sind und ob Ergebnisse zufällig entstanden sein könnten.

Statistik übernimmt deshalb gewissermaßen die Aufgabe eines Werkzeugs, mit dem Informationen geordnet, untersucht und interpretiert werden können. Sie beantwortet nicht automatisch Fragen und produziert auch keine Wahrheit. Vielmehr unterstützt sie dabei, Unsicherheit zu reduzieren und Entscheidungen auf nachvollziehbarere Grundlagen zu stellen.

Viele von uns verbinden Statistik wie schon zuvor erklärt mit Formeln oder Softwareprogrammen. Im akademischen Alltag beginnt Statistik jedoch schon sehr viel früher, nämlich bereits bei der Forschungsfrage. Bevor ein Test gewählt oder eine Tabelle erstellt wird, muss nämlich zunächst klar sein: Was möchte ich überhaupt herausfinden?

Was wissenschaftliche Statistik eigentlich macht

Stellen wir uns vor, jemand untersucht die Frage: „Beeinflusst Homeoffice die Arbeitszufriedenheit?“ Ohne Statistik könnten am Ende ungefähr folgende Aussagen entstehen:

„Ich glaube schon.“
„Mein Onkel arbeitet von zuhause und wirkt entspannter.“
„Bei mir war es anders.“

Das Problem ist aber: Wissenschaft mag Meinungen nicht besonders gern. Wissenschaft liebt Daten! Deswegen übernimmt die Statistik hier gewissermaßen die Rolle der kritischen Person im Freundeskreis und fragt:

Wie viele Personen wurden untersucht?
Gibt es tatsächlich einen Zusammenhang?
Wie stark ist dieser Zusammenhang?
Kann das Ergebnis Zufall sein?

Erst dann entstehen belastbare Aussagen.

Deskriptive Statistik: Daten beschreiben

Ein großer Teil wissenschaftlicher Arbeiten beginnt mit der ziemlich einfachen Aufgabe, Daten anzuschauen und zu beschreiben. Dafür haben wir in der Statistik sogar einen Begriff: Die sogenannte deskriptive Statistik. Sie beantwortet Fragen wie Wie alt sind die befragten Personen durchschnittlich?, Wie hoch ist der Mittelwert?, Wie stark unterscheiden sich Antworten?, Wie häufig tritt etwas auf?

Wenn jemand beispielsweise schreibt: "Das Durchschnittsalter der Stichprobe lag bei 24 Jahren.", dann ist das bereits Statistik.

Typische Begriffe der deskriptiven (beschreibenden!) Statistik sind:

Mittelwert (der Durchschnitt aller Werte; alles zusammenrechnen und durch die Anzahl teilen, z. B. Notendurchschnitt = 2,3)
Median (der mittlere Wert einer sortierten Datenreihe; bleibt stabiler, wenn einzelne Werte stark abweichen, z. B. Einkommen)
Standardabweichung (zeigt, wie stark Werte streuen; nahe 0 = sehr ähnliche Werte, ab ca. 1 oder höher oft größere Unterschiede, abhängig von der Skala)
Häufigkeiten (beschreiben, wie oft etwas vorkommt; z. B. 35 von 50 Personen antworten mit „Ja“)
Minimum & Maximum (der kleinste und größte Wert eines Datensatzes; z. B. Alter: Minimum = 19 Jahre, Maximum = 54 Jahre)Gerade diese typischen Begriffe bilden den Beginn fast jeder empirischen Arbeit.

Inferenzstatistik: Von wenigen auf viele schließen

Ab hier wird es ein wenig komplizierter, aber es ist immer noch gut verständlich und wirklich keine Raketenwissenschaft. Die Inferenzstatistik (die schlussfolgende Statistik) versucht, aus einer Stichprobe Rückschlüsse auf größere Gruppen zu ziehen. Beispiel: 100 Studierende werden befragt. Die eigentliche Frage lautet oft nicht: „Wie denken genau diese 100 Personen?“, sondern eher: „Lässt sich daraus etwas über Studierende allgemein ableiten?“

Und an dieser Stelle tauchen auch wieder sehr typische Begriffe auf, nämlich:

Hypothesentest (prüft, ob eine Annahme statistisch unterstützt wird; z. B. „Beeinflusst Schlaf die Studienleistung?“)
Signifikanz (beschreibt vereinfacht, ob ein Ergebnis vermutlich zufällig entstanden ist oder ob ein tatsächlicher Unterschied bzw. Zusammenhang vorliegen könnte; häufige Grenze: 0,05)
p-Wert (zeigt vereinfacht, wie gut die Daten zur Nullhypothese passen; je kleiner der p-Wert, desto weniger plausibel wirkt „kein Effekt/kein Unterschied“. Häufig gilt: p < 0,05 = statistisch signifikant)
t-Test (prüft, ob sich zwei Gruppen statistisch unterscheiden; z. B. Prüfungsangst bei Männern und Frauen oder Arbeitszufriedenheit im Homeoffice vs. Büro)
ANOVA (vergleicht Unterschiede zwischen drei oder mehr Gruppen; z. B. Zufriedenheit verschiedener Altersgruppen oder Studiengänge)
Regression (untersucht, ob und wie stark bestimmte Faktoren etwas beeinflussen oder vorhersagen; z. B. Lernzeit, Schlaf und Stress → Note)

Was Statistik mit Forschungsfragen zu tun hat

Ein häufiger Fehler vieler meiner Klienten entsteht ungefähr hier: Forschungsfrage schreiben. Daten sammeln. Statistik auswählen. Hoffen. Tatsächlich läuft die Reihenfolge anders herum. Eine statistische Methode wird nicht gewählt, weil sie kompliziert klingt oder in einer anderen Bachelorarbeit auftauchte, sondern weil sie zu Deiner eigenen Forschungsfrage passen muss. Also zum Beispiel:

Frage:
Besteht ein Zusammenhang zwischen Stress und Arbeitszufriedenheit?

Hier interessiert die Frage, ob zwei Variablen miteinander zusammenhängen. Steigt die Arbeitszufriedenheit, wenn Stress sinkt, oder verändert sich nichts? Für solche Fragestellungen werden häufig Korrelationen genutzt, etwa nach Pearson oder Spearman. Diese Verfahren untersuchen, ob zwischen zwei Variablen ein statistischer Zusammenhang besteht und wie stark dieser ausfällt.

Ein t-Test wäre hier wenig sinnvoll, weil er Unterschiede zwischen Gruppen prüft und nicht Zusammenhänge zwischen Variablen. Auch eine ANOVA passt nicht, da sie mehrere Gruppen miteinander vergleicht. Eine Regression könnte ebenfalls genutzt werden, wenn zusätzlich untersucht werden soll, wie stark Stress die Arbeitszufriedenheit beeinflusst oder vorhersagt. Für die reine Frage nach einem Zusammenhang ist eine Korrelation jedoch meist der erste Schritt.

→ Zusammenhang prüfen
→ Korrelation

Frage:
Unterscheiden sich Männer und Frauen hinsichtlich Prüfungsangst?

Hier geht es nicht um Zusammenhänge, sondern um Unterschiede zwischen zwei Gruppen. Die Frage lautet: Haben beide Gruppen vergleichbare Werte oder unterscheiden sie sich messbar? Für solche Fälle wird häufig ein t-Test genutzt.

Eine Korrelation wäre ungeeignet, weil nicht geprüft werden soll, ob zwei Variablen gemeinsam steigen oder sinken. Eine ANOVA wäre überdimensioniert, da sie typischerweise für drei oder mehr Gruppen eingesetzt wird. Eine Regression könnte theoretisch genutzt werden, wäre für diese einfache Fragestellung jedoch unnötig komplex.

→ Gruppen vergleichen
→ t-Test

Frage:
Beeinflussen Schlaf, Alter und Lernzeit die Note?

Hier geht es um mehrere Einflussgrößen, die gemeinsam auf ein Ergebnis wirken könnten. Die Note ist in diesem Fall die abhängige Variable, während Schlaf, Alter und Lernzeit als mögliche Einflussfaktoren betrachtet werden. Für solche Fragestellungen wird häufig eine Regression genutzt, weil sie prüfen kann, welche dieser Variablen mit der Note zusammenhängen und wie stark dieser Einfluss jeweils ausfällt.

Eine Korrelation wäre hier zu begrenzt, weil sie meist nur den Zusammenhang zwischen zwei Variablen betrachtet, zum Beispiel Schlaf und Note. Ein t-Test passt nicht, weil keine zwei Gruppen miteinander verglichen werden. Eine ANOVA wäre ebenfalls nicht passend, wenn es nicht um Gruppenunterschiede geht, sondern um mehrere Einflussfaktoren auf ein Ergebnis.

→ mehrere Einflussgrößen
→ Regression

Ich hoffe Du verstehst, dass sich ein Groß der Verwirrung legt, sobald Du anfängst zu verstehen, welche Frage beantwortet werden muss.

Statistik ist ein Werkzeug und kein Selbstzweck

Nach einigen hundert empirischen Arbeiten und unzähligen Gesprächen mit Studierenden kann ich Euch etwas sagen, das viele vermutlich früher hätten hören sollen: Eine wissenschaftliche Arbeit wird nicht besser, nur weil ihr möglichst viele statistische Verfahren darin einbaut. Ich habe Arbeiten gesehen, in denen Regressionen, Korrelationen und weitere Tests verwendet wurden, während die eigentliche Forschungsfrage kaum beantwortet wurde und keines dieser Verfahren erforderte. Das erinnert de facto an jemanden, der eine Küche besitzt, in der fünf Mixer stehen, aber niemand weiß, wie man ein Ei brät.

Ein sauber erklärter Mittelwert mit einer nachvollziehbaren Interpretation kann deutlich wertvoller sein als eine komplizierte Analyse, die irgendwo aus einer anderen Bachelorarbeit übernommen wurde und am Ende nicht verstanden wird. Ich erinnere mich beispielsweise an einen anonymisierten Fall aus dem Bereich Psychologie. Die Forschungsfrage lautete sinngemäß: „Inwiefern besteht ein Zusammenhang zwischen dem Persönlichkeitsmerkmal Neurotizismus (Big Five) und Prüfungsangst bei Studierenden?“ Eigentlich eine relativ klare Fragestellung. Es gibt eine Variable (Neurotizismus) und eine zweite Variable (Prüfungsangst). Gesucht wird ein Zusammenhang. Mehr nicht.

Die sinnvolle statistische Überlegung wäre ungefähr gewesen:

Daten beschreiben
→ Mittelwerte, Standardabweichungen, Minimum und Maximum
Reliabilität prüfen
→ Cronbachs Alpha, um zu untersuchen, ob die Items der Skala zuverlässig dasselbe Konstrukt messen (häufige Orientierung: α ≥ 0,70 = akzeptabel, α ≥ 0,80 = gut)
Zusammenhang prüfen
→ Korrelation, weil untersucht werden soll, ob höhere Neurotizismus-Werte mit stärkerer Prüfungsangst einhergehen
Optional: Einfluss genauer betrachten
→ Regression, wenn zusätzlich geprüft werden soll, wie stark Neurotizismus Prüfungsangst vorhersagen kann

Damit wäre die Forschungsfrage bereits sauber beantwortbar gewesen.

Stattdessen enthielt die Auswertung unter anderem (kein Scherz!):

mehrere t-Tests, obwohl keine Gruppen miteinander verglichen wurden
eine ANOVA, obwohl keine Unterschiede zwischen drei oder mehr Gruppen untersucht werden sollten
einen Chi-Quadrat-Test, obwohl die Variablen auf Skalenwerten basierten
Auswertungen nach Studienfach, obwohl dies nicht Teil der Forschungsfrage war
zusätzliche Signifikanztests zwischen Alter und Lernzeit, obwohl diese Variablen ursprünglich keine Rolle spielten

Die Arbeit wirkte auf den ersten Blick solide und durchdacht. Es gab viele Tabellen, p-Werte und Abbildungen en masse. Das Problem war nur, dass die eigentliche Forschungsfrage am Ende nicht adressiert wurde und das Feedback der Betreuerin entsprechend vernichtend war.

Meine Expertisebereiche

"Als Senior-Ghostwriter habe ich in den letzten fünf Jahren über 280 statistiklastige Projekte begleitet. Von Haus-, Bachelor- und Masterarbeiten bis hin zur Begleitung von Doktorarbeiten. Die häufigsten Fachbereiche sind in absteigender Reihenfolge: Medizin im Doktorgrad, Psychologie im Mastergrad und Wirtschaft ebenfalls im Mastergrad."

Amin Rafiki

Psychologie

SPSS

Mein Präferenzprogramm

Besondere Expertise

Kontakt

3. Wann braucht man Statistik überhaupt?

Eine Frage, die ich erstaunlich häufig höre, lautet: „Hey Amin, ich schreibe gerade meine Bachelorarbeit. Brauche ich jetzt SPSS?“ Hier gilt: Nicht jede wissenschaftliche Arbeit braucht Statistik!

Wenn Du eigene Daten erhebst, also Umfragen durchführst, Fragebögen auswertest, Gruppen vergleichst oder Zusammenhänge untersuchen möchtest, wird Statistik regelmäßig relevant. Das betrifft viele empirische Arbeiten aus Psychologie, BWL, Gesundheitswissenschaften oder Sozialwissenschaften. Wer beispielsweise wissen möchte, ob Stress mit Schlafqualität zusammenhängt oder welche Faktoren Arbeitszufriedenheit beeinflussen, landet später oft bei statistischen Auswertungen.

Arbeiten, die hauptsächlich auf bestehender Literatur beruhen, benötigen dagegen keine Statistik. Systematische Literaturanalysen, theoretische Arbeiten, historische Analysen oder viele philosophische Fragestellungen kommen ohne SPSS, Regressionen oder Signifikanztests aus. Wenn untersucht wird, wie sich das Verständnis von Glück zwischen antiker Philosophie und moderner Psychologie verändert hat, werden Quellen analysiert und interpretiert. Statistik wäre dort also fehl am Platz.

Dazwischen liegen Arbeiten, die qualitative und quantitative Elemente kombinieren, etwa Interviews mit ergänzenden Fragebögen. Hier kann Statistik vorkommen, muss aber nicht den Schwerpunkt bilden. Wie mehrfach erwähnt hängt das vor allem von der zu untersuchenden Forschungsfrage ab.

Eine Erfahrung aus den letzten Jahren fällt mir immer wieder auf: Viele Studierende halten Statistik für schwierig, obwohl die eigentliche Frage viel früher beantwortet werden müsste: Welche Art von Arbeit schreibe ich überhaupt?

Die Antwort darauf entscheidet oft schon, ob Statistik später nötig wird oder nicht.

Danke, dass Du bis hierher gelesen hast. Dir scheint Statistik ja so richtig Spaß zu machen!

Dann melde Dich beim Spaßvogel:

Anfragen

4. Der typische Ablauf einer statistischen Auswertung in wissenschaftlichen Arbeiten

Am Anfang der akademisch orientierten Statistik steht die Forschungsfrage. Bevor Daten erhoben oder Verfahren ausgewählt werden, muss klar sein, was untersucht werden soll. Fragen wie „Besteht ein Zusammenhang zwischen Stress und Schlafqualität?“ oder „Beeinflusst Neurotizismus die Prüfungsangst?“ führen später zu unterschiedlichen statistischen Entscheidungen.

Darauf folgen häufig Hypothesen, also Annahmen darüber, was erwartet wird. Anschließend wird festgelegt, wie Daten erhoben werden sollen, etwa über Fragebögen, Skalen oder Umfragen, und wer an der Untersuchung teilnimmt. Diese Gruppe nennt man Stichprobe.

Erst danach werden Daten tatsächlich erhoben. Anschließend folgt oft ein Schritt, der ziemlich stark unterschätzt wird: Daten bereinigen. Fehlende Werte, doppelte Antworten oder unrealistische Angaben kommen häufiger vor, als mir als leidtragender Senior-Ghostwriter lieb ist.

Wenn mit Skalen gearbeitet wird, wird häufig auch die Reliabilität geprüft, und zwar mittels Cronbachs Alpha. Dabei geht es um die Frage, ob mehrere Items zuverlässig dasselbe messen. Werte ab etwa 0,70 gelten hier i.d.R. als akzeptabel.

Danach beginnt die deskriptive Statistik. Mittelwerte, Standardabweichungen, Häufigkeiten oder Minimum und Maximum helfen hier dabei zu verstehen, wie die Daten überhaupt aussehen. Aber auch Abbildungen und Diagramme finden hier ihre Daseinsberechtigung.

Erst jetzt folgt die eigentliche Analyse. Je nach Forschungsfrage kommen unterschiedliche Verfahren infrage. Zusammenhänge führen häufig zu Korrelationen, Gruppenvergleiche zu t-Tests oder ANOVAs und mehrere Einflussgrößen oft zu Regressionen. Programme wie SPSS, R oder Python werden meist erst an diesem Punkt relevant.

Nach der Berechnung folgt der Teil, an dem viele Schwierigkeiten entstehen: die Interpretation. Entscheidend bleibt jedoch eine ganz, ganz wichtige Frage:

Wurde beantwortet, was am Anfang untersucht werden sollte, nämlich die Forschungsfrage?

Viele Fehler entstehen aus meiner Erfahrung leider nicht erst bei der Berechnung selbst, sondern schon deutlich früher im Prozess. Genau deshalb schauen wir uns im nächsten Kapitel die Grundlage fast aller Analysen an: Variablen. Also die Frage, was eigentlich gemessen wird.

Also langsam scheint es statistisch signifikant, dass Du Hilfe brauchst!

Ich bin unverändert immer gut erreichbar:

Anfragen

5. Variablen verstehen: Die Grundlage fast jeder statistischen Auswertung

Alter ist eine Variable. Stressniveau ist eine Variable. Prüfungsangst, Schlafdauer, Einkommen, Arbeitszufriedenheit oder die Anzahl gelernter Stunden ebenfalls.

Nehmen wir eine Forschungsfrage: „Besteht ein Zusammenhang zwischen Schlafdauer und Prüfungsleistung bei Studierenden?“ Dann wären bereits zwei Variablen enthalten:

Schlafdauer
→ Anzahl der Stunden Schlaf

Prüfungsleistung
→ beispielsweise die Note

Ohne Variablen gäbe es keine Daten und ohne Daten keine statistische Auswertung. Deshalb beginnt fast jede empirische Arbeit mit der Frage, welche Variablen überhaupt untersucht werden? Im Studium tauchen dabei häufig drei Arten auf.

Die unabhängige Variable beschreibt meist den möglichen Einflussfaktor. Also etwas, das einen Effekt haben könnte.

Beispiel:

Lernzeit → Prüfungsnote

Hier wäre die Lernzeit die unabhängige Variable.

Die abhängige Variable beschreibt dagegen das Ergebnis oder Merkmal, das untersucht wird.

Im selben Beispiel:

Prüfungsnote → abhängige Variable

Dann gibt es noch Kontrollvariablen. Diese tauchen häufig auf, werden aber erstaunlich selten verstanden. Kontrollvariablen werden berücksichtigt, weil sie Ergebnisse mit beeinflussen könnten.

Beispiel:

Forschungsfrage:

„Beeinflusst Schlafdauer die Prüfungsnote?“

Zusätzlich könnten Alter, Studiengang oder Arbeitsstunden pro Woche Einfluss haben. Diese Größen werden manchmal kontrolliert, damit Ergebnisse nicht verzerrt werden.

Gerade in psychologischen Arbeiten oder Gesundheitswissenschaften kommen deshalb schnell mehrere Variablen gleichzeitig zusammen.

Wow, Du scheinst eine richtige Passion für die Statistik entwickelt zu haben!

Hier findest Du Deinen leidenschaftlichen Statistiker auf Abruf:

Anfragen

6. Skalenniveaus verstehen

Skalenniveaus beantworten eigentlich nur eine einfache Frage: Wie wurden Daten gemessen? Und genau davon hängt später ab, welche statistischen Verfahren überhaupt sinnvoll sind.

Bei einer Nominalskala werden Werte lediglich verschiedenen Kategorien zugeordnet. Geschlecht, Studiengang oder Wohnort wären typische Beispiele. Die Reihenfolge spielt keine Rolle. BWL ist nicht „mehr“ als Psychologie und Berlin nicht „größer“ als Köln. Hier werden häufig Häufigkeiten oder Chi-Quadrat-Tests genutzt.

Die Ordinalskala besitzt zusätzlich eine Reihenfolge. Zufriedenheit auf einer Skala von 1 bis 5 wäre ein klassisches Beispiel. Eine Person mit einer 5 ist zufriedener als jemand mit einer 2. Wie groß dieser Unterschied wirklich ist, bleibt allerdings offen.

Die Intervallskala besitzt gleiche Abstände zwischen Werten. Temperatur in Celsius wird häufig genannt. Der Unterschied zwischen 10 °C und 20 °C entspricht dem Unterschied zwischen 20 °C und 30 °C. Ein echter Nullpunkt fehlt jedoch.

Die Verhältnisskala enthält zusätzlich einen natürlichen Nullpunkt. Alter, Einkommen, Gewicht oder Schlafdauer gehören dazu. 0 Stunden Schlaf bedeutet tatsächlich kein Schlaf. Genau deshalb lassen sich hier deutlich mehr Berechnungen durchführen.

Okay, Statistik scheint echt nicht Deine Stärke zu sein...

So verzweifle nicht, Pennäler! Und komme zum Berg:

Aufstieg

7. Deskriptive Statistik: Ein Abriss

Wenn SPSS oder R zum ersten Mal Ergebnisse ausgeben, erscheinen häufig Werte wie diese:

M = 3,84; SD = 0,92; Min = 1; Max = 5

Wenn Ihr das statistische Denken nicht gewohnt seid, schaut Ihr oft ungefähr so wie auf einen IKEA-Aufbauplan ohne Bilder. Hier müsst Ihr verstehen, dass diese Zahlen zunächst nur beschreiben, wie die Daten aussehen. Mehr nicht. Nehmen wir als Beispiel eine Befragung zur Prüfungsangst. Bevor untersucht wird, ob Neurotizismus, Stress oder Schlaf damit zusammenhängen, wird häufig zuerst beschrieben:

Wie hoch war die durchschnittliche Prüfungsangst?
Wie stark unterscheiden sich Antworten?
Wie alt waren Teilnehmende?
Gab es extreme Werte?

Ein Ergebnisteil könnte dann lauten:

Die Prüfungsangst der Stichprobe lag im Mittel bei 3,8 Punkten (SD = 0,9). Das Alter variierte zwischen 19 und 34 Jahren.

8. Daten visualisieren

Irgendwann kommt fast jede empirische Arbeit an den Punkt, an dem Zahlen nicht mehr nur beschrieben, sondern dargestellt werden sollen. Genau dann tauchen Diagramme auf. Die Darstellung von Daten hat einen simplen Zweck: Ergebnisse schneller verständlich machen.

Balkendiagramme eignen sich häufig für Gruppenvergleiche. Beispielsweise unterschiedliche Stresswerte zwischen Studiengängen.

Kreisdiagramme zeigen Anteile, etwa Geschlechterverteilungen. Werden oft genutzt. Nicht immer sinnvoll.

Histogramme helfen dabei zu erkennen, wie Werte verteilt sind. Gerade bei Normalverteilungen relevant.

Boxplots zeigen Streuungen, Medianwerte und mögliche Ausreißer. Viele ignorieren sie, obwohl sie oft schneller Probleme sichtbar machen als Tabellen.

Tabellen bleiben dennoch Standard in Ergebnisteilen, weil sie präziser sind als Grafiken.

Mein Tipp ist, dass Ihr Euch folgendes merkt: Eine gute Darstellung beantwortet im Idealfall sofort eine Frage. Schlechte Darstellungen erzeugen neue. Eure Betreuer erkennen an Diagrammen ziemlich schnell, ob Ihr Eure eigenen Daten verstanden habt oder nicht.

9. Hypothesen testen: Der Punkt, an dem viele anfangen, Statistik unnötig kompliziert zu finden

Spätestens hier tauchen Begriffe auf, die bei den meisten von uns ungefähr dieselbe Reaktion auslösen: Nullhypothese, Signifikanzniveau, p-Wert. Klingt zunächst kompliziert, verfolgt am Ende aber eine relativ einfache Idee. Fast jede empirische Arbeit versucht irgendwann eine Annahme zu prüfen. Angenommen die Forschungsfrage lautet: „Besteht ein Zusammenhang zwischen Stress und Prüfungsangst bei Studierenden?“

Dann entstehen im Hintergrund häufig zwei gegensätzliche Annahmen. Die Nullhypothese (H₀) behauptet zunächst, dass kein Zusammenhang existiert. Die Alternativhypothese (H₁) geht davon aus, dass ein Zusammenhang besteht. Statistik versucht anschließend nicht zu beweisen, dass die Alternativhypothese wahr ist. Stattdessen wird geprüft, wie plausibel die Nullhypothese anhand der Daten noch wirkt.

Genau hier erscheint später normalerweise der p-Wert. Wenn tatsächlich kein Zusammenhang bestehen würde, wären die beobachteten Daten eher unwahrscheinlich. Das heißt aber nicht, dass etwas bewiesen wurde und auch nicht automatisch, dass ein Ergebnis praktisch relevant ist. Ein kleines Beispiel macht das hoffentlich greifbarer. Stellen wir uns vor, untersucht werden Unterschiede in der Prüfungsangst zwischen Studierenden mit Nebenjob und ohne Nebenjob. Nach der Analyse ergibt sich: p = 0,018. Da dieser Wert kleiner als 0,05 ist, würde die Nullhypothese häufig verworfen werden. Die Daten sprechen eher dafür, dass Unterschiede bestehen könnten. Ein Ergebnissatz könnte dann lauten:

„Studierende mit Nebenjob zeigten signifikant höhere Prüfungsangst als Studierende ohne Nebenjob (p = .018).“

Das klingt zunächst eindeutig. Es fehlt jedoch eine weitere Frage:

Wie groß ist dieser Unterschied überhaupt?

Wenn sich die Mittelwerte nur minimal unterscheiden, kann ein Ergebnis statistisch signifikant sein, praktisch aber kaum Bedeutung besitzen. Genau deshalb werden häufig zusätzlich Effektgrößen betrachtet.

Ein stark anonymisierter Fall aus meinem Alltag sei hierfür exemplarisch herangezogen. Die Forschungsfrage lautete sinngemäß: „Beeinflusst die tägliche Social-Media-Nutzung depressive Symptome bei Studierenden?“

Kurz zum Setting: Eigene Datenerhebung, etwa 160 Teilnehmende, mehrere Skalen. Die Fragestellung war per se klar. Die Auswertung ignorierte das aber leider. Enthalten waren unter anderem mehrere t-Tests zwischen Altersgruppen, eine ANOVA nach Studienfach, zusätzliche Signifikanztests zwischen Schlafdauer und Geschlecht sowie Korrelationen zu Variablen, die in der eigentlichen Forschungsfrage nie vorkamen. Zusätzlich wurde ein p-Wert von 0,047 im Ergebnisteil so behandelt, als wäre damit die komplette Forschungsfrage beantwortet.

Doch was fast komplett ignoriert wurde, war, welche Hypothese überhaupt beantwortet werden sollte? Die Forschungsfrage zielte ja klar auf einen möglichen Zusammenhang zwischen Social-Media-Nutzung und depressiven Symptomen ab. Sinnvoll wäre also ungefähr folgende Reihenfolge gewesen:

Zunächst Daten beschreiben, anschließend Reliabilität der Skalen prüfen, danach Zusammenhänge untersuchen und gegebenenfalls über eine Regression genauer betrachten, wie stark Social-Media-Nutzung depressive Symptome vorhersagen kann.

Du brauchst Hilfe bei der Erstellung von Hypothesen & Fragebogen?

Du müsstest Dich hypothetisch nur melden:

Anfragen

10. Korrelationen verstehen

Korrelationen tauchen in empirischen Arbeiten häufig auf, weil viele Forschungsfragen am Anfang erstaunlich unspektakulär sind. Es geht oft nicht darum, etwas zu beweisen, sondern zunächst nur herauszufinden, ob zwei Dinge überhaupt gemeinsam auftreten. Besteht ein Zusammenhang zwischen Stress und Schlafqualität? Hängt Neurotizismus mit Prüfungsangst zusammen? Geht hohe Arbeitsbelastung mit geringerer Zufriedenheit einher? Solche Fragen landen relativ schnell bei Korrelationen. Die Berechnung selbst ist heute selten die Schwierigkeit. SPSS erledigt das in Sekunden. Anspruchsvoller wird meist die Interpretation danach.

Ein Korrelationswert bewegt sich typischerweise zwischen -1 und +1. Positive Werte sprechen eher dafür, dass zwei Variablen gemeinsam steigen. Negative Werte deuten eher darauf hin, dass mit zunehmender Ausprägung der einen Variable die andere sinkt. Werte nahe 0 zeigen häufig keinen erkennbaren linearen Zusammenhang. Ein Ergebnis von r = 0,62 wirkt zunächst stärker als r = 0,18, sagt aber noch nichts darüber aus, warum dieser Zusammenhang existiert. Genau an dieser Stelle entsteht in Ergebnisteilen regelmäßig ein Bruch zwischen Daten und Interpretation. Aus „Stress und Schlaf hängen zusammen“ wird plötzlich „Stress verschlechtert Schlaf“. Aus „Arbeitszufriedenheit korreliert mit Burnout“ entsteht „Unzufriedenheit verursacht Burnout“. Die Formulierungen wirken klein, verändern die Aussage jedoch vollständig.

Wenn eine Untersuchung beispielsweise zeigt, dass höhere Lernzeiten mit besseren Noten einhergehen, klingt die schnelle Schlussfolgerung nachvollziehbar: Mehr Lernen verbessert Leistungen. Vielleicht stimmt das sogar. Vielleicht lernen leistungsstarke Personen aber grundsätzlich strukturierter. Vielleicht schlafen sie besser oder besitzen andere Voraussetzungen. Vielleicht existieren mehrere Einflüsse gleichzeitig. Eine Korrelation trennt diese Dinge nicht sauber voneinander. Sie zeigt zunächst nur Muster. Und Muster sind noch keine Ursachen.

11. Gruppen vergleichen (t-Test und ANOVA)

Bis hierhin ging es häufig um Zusammenhänge. Also Fragen wie: „Steigt Variable A gemeinsam mit Variable B?“ Irgendwann ändern sich Forschungsfragen jedoch leicht und plötzlich lautet die Überlegung nicht mehr, ob etwas zusammenhängt, sondern ob sich Gruppen unterscheiden.

Die Formulierungen klingen dann ungefähr so:

Unterscheiden sich Männer und Frauen hinsichtlich ihrer Prüfungsangst?
Unterscheiden sich Personen im Homeoffice von Personen im Büro hinsichtlich ihrer Arbeitszufriedenheit?
Gibt es Unterschiede zwischen Studierenden verschiedener Studiengänge?

Nehmen wir eine Untersuchung zur Prüfungsangst. Angenommen, eine Gruppe von Studierenden arbeitet neben dem Studium mehr als 20 Stunden pro Woche und eine zweite Gruppe arbeitet gar nicht. Nun soll geprüft werden, ob sich beide Gruppen hinsichtlich ihrer Prüfungsangst unterscheiden. Die Daten könnten später ungefähr zeigen:

Gruppe ohne Nebenjob: Mittelwert = 2,8
Gruppe mit Nebenjob: Mittelwert = 3,7

Die Mittelwerte unterscheiden sich sichtbar. Reicht das bereits aus, um von einem echten Unterschied zu sprechen? Die Antwort ist not really. Denn Unterschiede entstehen manchmal auch zufällig. Genau deshalb taucht hier häufig der t-Test auf. Er prüft vereinfacht, ob sich zwei Gruppen statistisch voneinander unterscheiden oder ob beobachtete Unterschiede eher zufällig wirken könnten. Ein Ergebnis könnte beispielsweise ergeben: p = 0,012. Dann würde häufig angenommen, dass sich die Gruppen unterscheiden. Viele Studierende stoppen an dieser Stelle. In der Praxis folgt jedoch noch eine zweite Frage: Wie groß ist dieser Unterschied überhaupt?

Noch interessanter wird es, wenn nicht zwei Gruppen verglichen werden, sondern mehrere. Angenommen untersucht wird: Unterscheiden sich Studierende aus Psychologie, BWL und Medizin hinsichtlich ihres Stressempfindens? Jetzt existieren nicht mehr zwei Gruppen, sondern drei. An dieser Stelle erscheint häufig die ANOVA (Varianzanalyse).

Die ANOVA prüft zunächst nur: Gibt es irgendwo zwischen den Gruppen Unterschiede? Sie beantwortet nicht automatisch: Zwischen welchen Gruppen genau? Wenn eine ANOVA signifikant ausfällt, folgen häufig zusätzliche Tests, um die Unterschiede genauer einzugrenzen. Gerade hier entstehen viele Fehler, weil zumeist aus fehlendem Verständnis Verfahren gewählt werden, die zur Forschungsfrage gar nicht passen. Es gilt:

Wenn zwei Gruppen verglichen werden sollen, ist eine ANOVA häufig unnötig kompliziert.

Wenn mehrere Gruppen betrachtet werden, reicht ein einfacher t-Test meist nicht mehr.

Und wenn eigentlich Zusammenhänge untersucht werden sollen, wären beide Verfahren unpassend.