Was ist die Pearson-Korrelation? Ein Leitfaden für Psychologie und R Studio

6. Apr.
4 Min. Lesezeit

Die Pearson-Korrelation ist ein weit verbreitetes statistisches Verfahren, das oft in psychologischen Studien verwendet wird, um lineare Zusammenhänge zwischen zwei Variablen zu messen. In diesem Artikel erkläre ich dir, was die Pearson-Korrelation ist, welche Voraussetzungen erfüllt sein müssen und wie du sie mit R Studio berechnest.

Was ist die Pearson-Korrelation?

Die Pearson-Korrelation, oft auch als Produkt-Moment-Korrelation bezeichnet, misst die Stärke und Richtung der linearen Beziehung zwischen zwei kontinuierlichen Variablen. Der Korrelationskoeffizient r nimmt Werte zwischen -1 und +1 an:

+1: Perfekte positive Korrelation (beide Variablen steigen gemeinsam)
-1: Perfekte negative Korrelation (eine Variable steigt, während die andere sinkt)
0: Keine lineare Beziehung zwischen den Variablen

Die Pearson-Korrelation wird häufig verwendet, um Zusammenhänge in Bereichen wie Psychologie, Soziologie und Medizin zu untersuchen. Sie eignet sich besonders gut für intervallskalierte Daten und ermöglicht es, Zusammenhänge in einfachen, interpretierbaren Zahlen auszudrücken. Beispielsweise könnte man untersuchen, wie das Selbstwertgefühl mit der Lebenszufriedenheit zusammenhängt.

Wenn du weitere Unterstützung bei statistischen Methoden benötigst oder professionelle Beratung suchst, kontaktiere mich für maßgeschneiderte Hilfe.

Voraussetzungen für die Pearson-Korrelation

Damit die Pearson-Korrelation sinnvoll angewendet werden kann, müssen folgende Voraussetzungen erfüllt sein:

Intervall- oder Verhältnisskala: Beide Variablen müssen mindestens intervallskaliert sein. Dies wird durch das Messinstrument gewährleistet und muss nicht extra getestet werden.
Normalverteilung: Die Daten sollten (nahezu) normalverteilt sein, besonders bei kleineren Stichproben. Dies kann mit dem Shapiro-Wilk-Test oder durch die Kennwerte der Schiefe und Kurtosis überprüft werden.

Schritt-für-Schritt-Anleitung: Pearson-Korrelation in R Studio berechnen

Hier zeige ich dir, wie du die Pearson-Korrelation in R Studio berechnest. Dabei verwende ich einen wir einen Beispiel-Datensatz mit den Variablen Selbstwertgefühl, Stresslevel, Lebenszufriedenheit und Motivation.

Schritt 1: Installiere und lade die benötigten Pakete

Um die Pearson-Korrelation korrekt zu berechnen und die Ergebnisse im APA-Format darzustellen, müssen zunächst die notwendigen R-Pakete installiert und geladen werden.

R Studio Code zum Installieren und Laden der Pakete apaTables und pastecs für Pearson Korrelation und statistische Auswertung

Diese Pakete sind entscheidend, da apaTables die Erstellung von APA-konformen Tabellen ermöglicht und pastecs hilfreiche Funktionen für die Berechnung von deskriptiven Statistiken und Tests der Normalverteilung bietet.

Schritt 2: Teste die Voraussetzungen der Normalverteilung

Bevor die Pearson-Korrelation angewendet wird, ist es wichtig, sicherzustellen, dass die Daten annähernd normalverteilt sind. Mit dem pastecs-Paket kann dies durch den Shapiro-Wilk-Test geprüft werden. Der Normalverteilungstest versteckt sich auf Seite 2 der Ausgabe der Funktion stat.desc() unter normtest.p (oranger Pfeil).

Deskriptive Statistiken in R Studio mit stat.desc Funktion inklusive Mittelwert, Standardabweichung, Schiefe und Kurtosis zur Prüfung der Normalverteilung

Shapiro-Wilk-Test Ergebnisse in R Studio zur Überprüfung der Normalverteilung für Pearson Korrelation mit p-Werten der Variablen

Die Ergebnisse der Variablen Selbstwertgefühl, Lebenszufriedenheit und Motivation zeigen, dass die Normalverteilungsannahme für diese Variablen nicht verletzt ist, da der p-Wert des Shapiro-Wilk-Testsjeweils größer als .05 ist.

Im Gegensatz dazu wird der Shapiro-Wilk-Test für die Variable Stresslevel signifikant, p = .037, was darauf hinweist, dass die Normalverteilungsannahme für den Stresslevel verletzt ist. Dennoch sollten ergänzende Metriken wie die Schiefe und Kurtosis betrachtet werden:

Schiefe: 0.63
Kurtosis: 0.58

Diese Werte liegen innerhalb eines akzeptablen Rahmens für Abweichungen von der Normalverteilung. Daher kann die Verletzung der Normalverteilungsannahme als geringfügig angesehen werden, sodass die Pearson-Korrelation weiterhin verwendet werden kann.

Wenn du weitere Unterstützung bei statistischen Methoden benötigst oder professionelle Beratung suchst, kontaktiere mich für maßgeschneiderte Hilfe.

Schritt 3: Berechnung der Pearson-Korrelation für zwei Variablen

Wenn nur zwei Variablen untersucht werden sollen, kann die Pearson-Korrelation wie folgt berechnet werden. Hier werden die Variablen Selbstwertgefühl und Stresslevel miteinander verglichen.

Pearson Korrelation in R Studio berechnen mit cor.test Funktion inklusive Korrelationskoeffizient r und p-Wert für zwei Variablen

Die Ausgabe zeigt den Korrelationskoeffizienten (r = −.05) sowie den p-Wert (p = .625), was darauf hinweist, dass keine signifikante Korrelation zwischen den beiden Variablen vorliegt.

Wenn du weitere Unterstützung bei statistischen Methoden benötigst oder professionelle Beratung suchst, kontaktiere mich für maßgeschneiderte Hilfe.

Schritt 4: Pearson-Korrelation mit mehreren Variablen und Darstellung im APA-Format

Wenn du nicht nur zwei, sondern mehrere Variablen betrachten möchtest, kannst du die apa.cor.table()Funktion nutzen. Diese gibt eine Korrelationstabelle im APA-Format aus, inklusive Mittelwerten (M) und Standardabweichungen (SD).

APA-formatierte Korrelationsmatrix in R Studio mit apa.cor.table inklusive Pearson Korrelationen, Mittelwerten und Standardabweichungen für mehrere Variablen

Diese Tabelle enthält die Korrelationen zwischen allen Variablen (z.B. Selbstwertgefühl, Stresslevel, Lebenszufriedenheit und Motivation) und gibt die Mittelwerte sowie Standardabweichungen für jede Variable an.

In unserem Beispiel sehen wir die folgenden Korrelationen zwischen den psychologischen Variablen:

Selbstwertgefühl und Stresslevel: r= −.05,
Selbstwertgefühl und Lebenszufriedenheit: r = − .13
Stresslevel und Lebenszufriedenheit: r = .03

Die einzelnen p-Werte werden in dieser Tabelle nicht direkt ausgegeben. Wäre jedoch eine signifikante Korrelation vorhanden, würde diese durch ein * neben dem Korrelationskoeffizienten in der Tabelle markiert werden. Im vorliegenden Fall ist jedoch keine der Korrelationen signifikant, da alle p-Werte größer als 0.05 sind. Das bedeutet, dass keine der Korrelationen in diesem Beispiel statistisch signifikant ist.

FAQs zur Pearson-Korrelation

1. Was ist die Pearson-Korrelation?

Die Pearson-Korrelation misst die Stärke und Richtung einer linearen Beziehung zwischen zwei kontinuierlichen Variablen. Der Korrelationskoeffizient rrr kann Werte zwischen -1 und +1 annehmen, wobei +1 eine perfekte positive und -1 eine perfekte negative Korrelation darstellt. Ein Wert von 0 bedeutet, dass keine lineare Beziehung vorliegt.

2. Welche Voraussetzungen müssen für die Pearson-Korrelation erfüllt sein?

Es gibt vier Hauptvoraussetzungen:

Lineare Beziehung zwischen den Variablen
Beide Variablen müssen mindestens intervallskaliert sein
Normalverteilung der Daten
Homoskedastizität (gleichmäßige Varianzverteilung)

3. Wie interpretiere ich die Ergebnisse einer APA-Korrelationstabelle?

In der APA-Korrelationstabelle werden die Korrelationskoeffizienten rrr, die Mittelwerte (M) und Standardabweichungen (SD) angezeigt. Wenn eine Korrelation signifikant ist, wird dies durch ein * neben dem Korrelationskoeffizienten gekennzeichnet. In der Tabelle werden auch 95%-Konfidenzintervalle dargestellt.

4. Was bedeutet es, wenn keine Korrelation signifikant ist?

Wenn keine der Korrelationen signifikant ist (d.h., alle p-Werte sind größer als 0.05), bedeutet dies, dass keine statistisch nachweisbare lineare Beziehung zwischen den untersuchten Variablen besteht. Es ist wichtig, dass diese Ergebnisse im Kontext der Daten und Hypothesen interpretiert werden.

5. Kann ich die Pearson-Korrelation verwenden, wenn meine Daten nicht normalverteilt sind?

Wenn die Normalverteilungsannahme verletzt ist, sollte überlegt werden, alternative Korrelationsmethoden wie die Spearman-Korrelation zu verwenden, die nicht auf Normalverteilung angewiesen ist. Allerdings können leichte Abweichungen von der Normalverteilung oft noch toleriert werden, solange die anderen Voraussetzungen erfüllt sind.

Wenn du weitere Unterstützung bei statistischen Methoden benötigst oder professionelle Beratung suchst, kontaktiere mich für maßgeschneiderte Hilfe.