DS erweitert R

Lösungen für den erweiterten Datensatz

Autor:in

R. Lau

Veröffentlichungsdatum

22. Mai 2023

1 Vorbereitung

1.1 Pakete laden

Als erstes müssen in R die Pakete geladen werden, die für das Projekt notwendig sind. Die Pakete einhalten alle notwendigen Formeln und Funktionen für die Berechnungen und Darstellungen.

# Abhängigkeiten
library(tidyverse)
library(readr)
library(conflicted)
library(haven)
library(dplyr)
library(pwr)
library(psych)
library(car)
library(kableExtra)
library(knitr)
library(quarto)
library(rmarkdown)

1.2 Daten importieren

Um den vorgegebenen Datensatz in allen Ergebnissen “sicherer” zu machen, habe ich den Datensatz auf 252 Zeilen erweitert. Alle Vektoren des erweiterten Datensatzes entsprechen den Datentypen und Wertebereichen des ursprünglichen Datensatzes.

Beschreibung des importierten Datensatzes a.matrix
Probandennummer Beruf Beruf_n AV Kaffee Wasser Extra_2 Diff
Min. : 1.00 Length:252 Min. :1.000 Min. :11.00 Min. : 62 Min. :16.00 Min. :-1.488796 Min. : 46.00
1st Qu.: 63.75 Class :character 1st Qu.:1.000 1st Qu.:48.00 1st Qu.: 98 1st Qu.:29.00 1st Qu.:-0.319614 1st Qu.: 69.00
Median :126.50 Mode :character Median :2.000 Median :57.00 Median :107 Median :33.00 Median :-0.025734 Median : 74.00
Mean :126.50 NA Mean :1.583 Mean :58.44 Mean :108 Mean :32.99 Mean : 0.008248 Mean : 75.05
3rd Qu.:189.25 NA 3rd Qu.:2.000 3rd Qu.:68.00 3rd Qu.:117 3rd Qu.:36.00 3rd Qu.: 0.310862 3rd Qu.: 81.00
Max. :252.00 NA Max. :2.000 Max. :98.00 Max. :147 Max. :47.00 Max. : 1.279400 Max. :100.00

2 AUFGABE 1

Die Variable Extra_2 repräsentiert Extraversions-Scores der Probanden. Der Populationsmittelwert für Extraversion beträgt 2. Prüfen Sie mit Hilfe eines geeigneten statistischen Verfahrens, ob die Stichprobe zu dieser Population oder zu einer anderen Population gehört (α = .10, zweiseitig). Betrachten Sie die Ausgabe. Wie lautet die Testentscheidung?

2.1 Normalverteilung für Extra_2 testen

Shapiro-Wilk-Test für Extra_2
statistic c(W = 0.99648801416134)
p.value 0.849329589605043
method Shapiro-Wilk normality test
data.name erweitert$Extra_2

ERGEBNIS: p-value = 0.8493296 > α = 0.05 → es liegt eine Normalverteilung vor.

2.2 Einstichproben-t-Test für Extra_2

Bedingungen µ₀ = 2 → mu = 2, Konfidenzintervall 1 - σ für σ = 0.1 ⇒ conf.levvel 0.9

H₀ = Stichprobe gehört zur Population

H₁ = Stichprobe gehört NICHT zur Population

t-Test Extra_2
statistic c(t = -64.1534374411939)
parameter c(df = 251)
p.value 1.08313336961588e-157
conf.int c(-0.0430086397642859, 0.0595042570161475)
estimate c(`mean of x` = 0.00824780862593065)
null.value c(mean = 2)
stderr 0.0310466947807715
alternative two.sided
method One Sample t-test
data.name erweitert$Extra_2

ERGEBNIS: p-value = 1.0831334^{-157} = 0.0000… < σ = 0.1 → H₀ verwerfen, Stichprobe gehört NICHT zur Population.

3 Aufgabe 2

Sie möchten jetzt prüfen, ob Soldaten extravertierter als Studenten sind. Führen Sie den t-Test durch und entscheiden Sie bei α = .05. Was sehen Sie in der Ausgabe? Wie lautet der p-Wert, den Sie zum Vergleich heranziehen müssen? Wie lautet die Testentscheidung?

3.1 Datensatz Extra_2 gruppieren

3.2 Gruppen auf Normalverteilung testen

3.2.1 Gruppe SOLDATEN

Shapiro-Wilk-Test für die Gruppe SOLDATEN
statistic c(W = 0.996212660415187)
p.value 0.993702944346935
method Shapiro-Wilk normality test
data.name erweitert.sold$Extra_2

ERGEBNIS SOLDATEN: p-value = 0.9937029 > α = 0,05 → es liegt eine Normalverteilung vor.

3.2.2 Gruppen STUDENTEN

Shapiro-Wilk-Test für die Gruppe STUDENTEN
statistic c(W = 0.993078230960078)
p.value 0.701714202900116
method Shapiro-Wilk normality test
data.name erweitert.stud$Extra_2

ERGEBNIS STUDENTEN: p-value = 0.7017142 > α = 0,05 → es liegt eine Normalverteilung vor.

3.3 Levene-Test zur Überprüfung, ob Varianzhomogenität gegeben ist (𝝈 = 0.05)

Levene-Test zur Überprüfung der Varianzhomogenität
Df F value Pr(>F)
group 1 1.227511 0.2689565
250 NA NA

ERGEBNIS Levene-Test: die Signifikanz liegt mit Pr(\>F) = 0.2689565 > 𝝈 = 0.05 also ist von einer Varianzhomogenität auszugehen.

3.4 Zwei-Stichproben-Hypothesentest ungerichtet

H₀: p.value > α = 0.05 Soldaten sind NICHT extravertierter als Studenten

H₁: p.value < α = 0.05 Soldaten sind extravertierter als Studenten

Zwei-Stichproben-Hypothesentest ungerichtet
statistic c(t = 0.84786341279519)
parameter c(df = 250)
p.value 0.397325049703262
conf.int c(-0.070673644742759, 0.177520522133886)
estimate c(`mean in group 1` = 0.0394114811983426, `mean in group 2` = -0.0140119574972207)
null.value c(`difference in means between group 1 and group 2` = 0)
stderr 0.0630094870109324
alternative two.sided
method Two Sample t-test
data.name erweitert$Extra_2 by erweitert$Beruf_n

ERGEBNIS t-Test: der p-Wert ist p-value = 0.397325 > α = 0.05 → der Test ist nicht signifikant, H₀ wird nicht verworfen

4 AUFGABE 3

Die Werte in den Spalten „Kaffee” und „Wasser” stellen Extraversions-Scores dar, die unter dem Einfluss von Kaffee und Wasser erhoben worden sind. Sie möchten testen, ob man nach Kaffee-Konsum extravertierter ist als nach Wasser-Konsum. Führen Sie hierfür einen t-Test für abhängige Stichproben durch. Was ist auffällig im Datenblatt im Gegensatz zum t-Test für unabhängige Stichproben? Betrachten Sie die Ausgabe. Wie lautet die Testentscheidung bei α= .05? (Für Voraussetzungen: „Diff” ist der Differenzwert der Messwertpaare Kaffe – Wasser)

4.1 t-test für abhängige Stichproben

4.1.1 Voraussetzungen

4.1.1.1 Liegen metrisch skalierte Variablen für den Mittelwertvergleich vor?

Test auf metrisch skalierte Variable für den Mittelwertvergleich
Length Class Mode
Kaffee 6 summaryDefault numeric
Wasser 6 summaryDefault numeric
Diff 6 summaryDefault numeric

Ergebnis: Kaffee, Wasser und Diff sind numerische Vektoren.

4.1.1.2 Shapiro-Wilk-Test für die Variable erweitert.diff.shap

Die Differenzen zwischen den Beobachtungen der beiden Stichproben sollten im Falle einer kleinen Stichprobe (Daumenregel: Stichprobengröße < 30) einer Normalverteilung folgen.

Shapiro-Wilk-Test Variable erweitert$Diff
statistic c(W = 0.995680595016814)
p.value 0.709496465080214
method Shapiro-Wilk normality test
data.name erweitert$Diff

ERGEBNIS: p-value = 0.7094965 > α = 0,05 → es liegt eine Normalverteilung vor.

4.1.2 t-test

Hypothesen

H₀: Die Reaktionen nach Wasser unterscheiden sich NICHT von denen nach Kaffee.

H₁: Die Reaktionen nach Wasser unterscheiden sich von denen nach Kaffee.

t-test für abhängige Stichproben Variablen erweitert$Kaffee, erweitert$Wasser
statistic c(t = 125.491420609812)
parameter c(df = 251)
p.value 1.77888780447344e-228
conf.int c(73.8698229867891, 76.2254151084489)
estimate c(`mean of the differences` = 75.0476190476191)
null.value c(`difference in means` = 0)
stderr 0.598029878719463
alternative two.sided
method Paired t-test
data.name erweitert$Kaffee and erweitert$Wasser

Ergebnis: p.value = 1.7788878^{-228} < α = 0,01. Der Test ist hochsignifikant. H₀ wird verworfen. Die Reaktionen nach Wasser unterscheiden sich von denen nach Kaffee.