# Abhängigkeiten
library(tidyverse)
library(readr)
library(conflicted)
library(haven)
library(dplyr)
library(pwr)
library(psych)
library(car)
library(kableExtra)
library(knitr)
library(quarto)
library(rmarkdown)
DS erweitert R
Lösungen für den erweiterten Datensatz
1 Vorbereitung
1.1 Pakete laden
Als erstes müssen in R die Pakete geladen werden, die für das Projekt notwendig sind. Die Pakete einhalten alle notwendigen Formeln und Funktionen für die Berechnungen und Darstellungen.
1.2 Daten importieren
Um den vorgegebenen Datensatz in allen Ergebnissen “sicherer” zu machen, habe ich den Datensatz auf 252 Zeilen erweitert. Alle Vektoren des erweiterten Datensatzes entsprechen den Datentypen und Wertebereichen des ursprünglichen Datensatzes.
Probandennummer | Beruf | Beruf_n | AV | Kaffee | Wasser | Extra_2 | Diff | |
---|---|---|---|---|---|---|---|---|
Min. : 1.00 | Length:252 | Min. :1.000 | Min. :11.00 | Min. : 62 | Min. :16.00 | Min. :-1.488796 | Min. : 46.00 | |
1st Qu.: 63.75 | Class :character | 1st Qu.:1.000 | 1st Qu.:48.00 | 1st Qu.: 98 | 1st Qu.:29.00 | 1st Qu.:-0.319614 | 1st Qu.: 69.00 | |
Median :126.50 | Mode :character | Median :2.000 | Median :57.00 | Median :107 | Median :33.00 | Median :-0.025734 | Median : 74.00 | |
Mean :126.50 | NA | Mean :1.583 | Mean :58.44 | Mean :108 | Mean :32.99 | Mean : 0.008248 | Mean : 75.05 | |
3rd Qu.:189.25 | NA | 3rd Qu.:2.000 | 3rd Qu.:68.00 | 3rd Qu.:117 | 3rd Qu.:36.00 | 3rd Qu.: 0.310862 | 3rd Qu.: 81.00 | |
Max. :252.00 | NA | Max. :2.000 | Max. :98.00 | Max. :147 | Max. :47.00 | Max. : 1.279400 | Max. :100.00 |
2 AUFGABE 1
Die Variable Extra_2 repräsentiert Extraversions-Scores der Probanden. Der Populationsmittelwert für Extraversion beträgt 2. Prüfen Sie mit Hilfe eines geeigneten statistischen Verfahrens, ob die Stichprobe zu dieser Population oder zu einer anderen Population gehört (α = .10, zweiseitig). Betrachten Sie die Ausgabe. Wie lautet die Testentscheidung?
2.1 Normalverteilung für Extra_2 testen
statistic | c(W = 0.99648801416134) |
p.value | 0.849329589605043 |
method | Shapiro-Wilk normality test |
data.name | erweitert$Extra_2 |
ERGEBNIS: p-value = 0.8493296 > α = 0.05 → es liegt eine Normalverteilung vor.
2.2 Einstichproben-t-Test für Extra_2
Bedingungen µ₀ = 2 → mu = 2, Konfidenzintervall 1 - σ für σ = 0.1 ⇒ conf.levvel 0.9
H₀ = Stichprobe gehört zur Population
H₁ = Stichprobe gehört NICHT zur Population
statistic | c(t = -64.1534374411939) |
parameter | c(df = 251) |
p.value | 1.08313336961588e-157 |
conf.int | c(-0.0430086397642859, 0.0595042570161475) |
estimate | c(`mean of x` = 0.00824780862593065) |
null.value | c(mean = 2) |
stderr | 0.0310466947807715 |
alternative | two.sided |
method | One Sample t-test |
data.name | erweitert$Extra_2 |
ERGEBNIS: p-value = 1.0831334^{-157} = 0.0000… < σ = 0.1 → H₀ verwerfen, Stichprobe gehört NICHT zur Population.
3 Aufgabe 2
Sie möchten jetzt prüfen, ob Soldaten extravertierter als Studenten sind. Führen Sie den t-Test durch und entscheiden Sie bei α = .05. Was sehen Sie in der Ausgabe? Wie lautet der p-Wert, den Sie zum Vergleich heranziehen müssen? Wie lautet die Testentscheidung?
3.1 Datensatz Extra_2 gruppieren
3.2 Gruppen auf Normalverteilung testen
3.2.1 Gruppe SOLDATEN
statistic | c(W = 0.996212660415187) |
p.value | 0.993702944346935 |
method | Shapiro-Wilk normality test |
data.name | erweitert.sold$Extra_2 |
ERGEBNIS SOLDATEN: p-value = 0.9937029 > α = 0,05 → es liegt eine Normalverteilung vor.
3.2.2 Gruppen STUDENTEN
statistic | c(W = 0.993078230960078) |
p.value | 0.701714202900116 |
method | Shapiro-Wilk normality test |
data.name | erweitert.stud$Extra_2 |
ERGEBNIS STUDENTEN: p-value = 0.7017142 > α = 0,05 → es liegt eine Normalverteilung vor.
3.3 Levene-Test zur Überprüfung, ob Varianzhomogenität gegeben ist (𝝈 = 0.05)
Df | F value | Pr(>F) | |
---|---|---|---|
group | 1 | 1.227511 | 0.2689565 |
250 | NA | NA |
ERGEBNIS Levene-Test: die Signifikanz liegt mit Pr(\>F) = 0.2689565 > 𝝈 = 0.05 also ist von einer Varianzhomogenität auszugehen.
3.4 Zwei-Stichproben-Hypothesentest ungerichtet
H₀: p.value > α = 0.05 Soldaten sind NICHT extravertierter als Studenten
H₁: p.value < α = 0.05 Soldaten sind extravertierter als Studenten
statistic | c(t = 0.84786341279519) |
parameter | c(df = 250) |
p.value | 0.397325049703262 |
conf.int | c(-0.070673644742759, 0.177520522133886) |
estimate | c(`mean in group 1` = 0.0394114811983426, `mean in group 2` = -0.0140119574972207) |
null.value | c(`difference in means between group 1 and group 2` = 0) |
stderr | 0.0630094870109324 |
alternative | two.sided |
method | Two Sample t-test |
data.name | erweitert$Extra_2 by erweitert$Beruf_n |
ERGEBNIS t-Test: der p-Wert ist p-value = 0.397325 > α = 0.05 → der Test ist nicht signifikant, H₀ wird nicht verworfen
4 AUFGABE 3
Die Werte in den Spalten „Kaffee” und „Wasser” stellen Extraversions-Scores dar, die unter dem Einfluss von Kaffee und Wasser erhoben worden sind. Sie möchten testen, ob man nach Kaffee-Konsum extravertierter ist als nach Wasser-Konsum. Führen Sie hierfür einen t-Test für abhängige Stichproben durch. Was ist auffällig im Datenblatt im Gegensatz zum t-Test für unabhängige Stichproben? Betrachten Sie die Ausgabe. Wie lautet die Testentscheidung bei α= .05? (Für Voraussetzungen: „Diff” ist der Differenzwert der Messwertpaare Kaffe – Wasser)
4.1 t-test für abhängige Stichproben
4.1.1 Voraussetzungen
4.1.1.1 Liegen metrisch skalierte Variablen für den Mittelwertvergleich vor?
Length | Class | Mode | |
---|---|---|---|
Kaffee | 6 | summaryDefault | numeric |
Wasser | 6 | summaryDefault | numeric |
Diff | 6 | summaryDefault | numeric |
Ergebnis: Kaffee, Wasser und Diff sind numerische Vektoren.
4.1.1.2 Shapiro-Wilk-Test für die Variable erweitert.diff.shap
Die Differenzen zwischen den Beobachtungen der beiden Stichproben sollten im Falle einer kleinen Stichprobe (Daumenregel: Stichprobengröße < 30) einer Normalverteilung folgen.
statistic | c(W = 0.995680595016814) |
p.value | 0.709496465080214 |
method | Shapiro-Wilk normality test |
data.name | erweitert$Diff |
ERGEBNIS: p-value = 0.7094965 > α = 0,05 → es liegt eine Normalverteilung vor.
4.1.2 t-test
Hypothesen
H₀: Die Reaktionen nach Wasser unterscheiden sich NICHT von denen nach Kaffee.
H₁: Die Reaktionen nach Wasser unterscheiden sich von denen nach Kaffee.
statistic | c(t = 125.491420609812) |
parameter | c(df = 251) |
p.value | 1.77888780447344e-228 |
conf.int | c(73.8698229867891, 76.2254151084489) |
estimate | c(`mean of the differences` = 75.0476190476191) |
null.value | c(`difference in means` = 0) |
stderr | 0.598029878719463 |
alternative | two.sided |
method | Paired t-test |
data.name | erweitert$Kaffee and erweitert$Wasser |
Ergebnis: p.value = 1.7788878^{-228} < α = 0,01. Der Test ist hochsignifikant. H₀ wird verworfen. Die Reaktionen nach Wasser unterscheiden sich von denen nach Kaffee.