1 Vorbereitung

1.1 Pakete laden

Als erstes müssen in R die Pakete geladen werden, die für das Projekt notwendig sind. Die Pakete einhalten alle notwendigen Formeln und Funktionen für die Berechnungen und Darstellungen.

# Abhängigkeiten
library(tidyverse)
library(readr)
library(conflicted)
library(haven)
library(dplyr)
library(pwr)
library(psych)
library(car)
library(kableExtra)
library(knitr)
library(quarto)
library(rmarkdown)

1.2 Daten importieren

Um den vorgegebenen Datensatz in allen Ergebnissen “sicherer” zu machen, habe ich den Datensatz auf 252 Zeilen erweitert. Alle Vektoren des erweiterten Datensatzes entsprechen den Datentypen und Wertebereichen des ursprünglichen Datensatzes.

Beschreibung des importierten Datensatzes a.matrix
Probandennummer	Beruf	Beruf_n	AV	Kaffee	Wasser	Extra_2	Diff
Min. : 1.00	Length:252	Min. :1.000	Min. :11.00	Min. : 62	Min. :16.00	Min. :-1.488796	Min. : 46.00
1st Qu.: 63.75	Class :character	1st Qu.:1.000	1st Qu.:48.00	1st Qu.: 98	1st Qu.:29.00	1st Qu.:-0.319614	1st Qu.: 69.00
Median :126.50	Mode :character	Median :2.000	Median :57.00	Median :107	Median :33.00	Median :-0.025734	Median : 74.00
Mean :126.50	NA	Mean :1.583	Mean :58.44	Mean :108	Mean :32.99	Mean : 0.008248	Mean : 75.05
3rd Qu.:189.25	NA	3rd Qu.:2.000	3rd Qu.:68.00	3rd Qu.:117	3rd Qu.:36.00	3rd Qu.: 0.310862	3rd Qu.: 81.00
Max. :252.00	NA	Max. :2.000	Max. :98.00	Max. :147	Max. :47.00	Max. : 1.279400	Max. :100.00

2 AUFGABE 1

Die Variable Extra_2 repräsentiert Extraversions-Scores der Probanden. Der Populationsmittelwert für Extraversion beträgt 2. Prüfen Sie mit Hilfe eines geeigneten statistischen Verfahrens, ob die Stichprobe zu dieser Population oder zu einer anderen Population gehört (α = .10, zweiseitig). Betrachten Sie die Ausgabe. Wie lautet die Testentscheidung?

2.1 Normalverteilung für Extra_2 testen

Shapiro-Wilk-Test für Extra_2
statistic	c(W = 0.99648801416134)
p.value	0.849329589605043
method	Shapiro-Wilk normality test
data.name	erweitert$Extra_2

ERGEBNIS: p-value = 0.8493296 > α = 0.05 → es liegt eine Normalverteilung vor.

2.2 Einstichproben-t-Test für Extra_2

Bedingungen µ₀ = 2 → mu = 2, Konfidenzintervall 1 - σ für σ = 0.1 ⇒ conf.levvel 0.9

H₀ = Stichprobe gehört zur Population

H₁ = Stichprobe gehört NICHT zur Population

t-Test Extra_2
statistic	c(t = -64.1534374411939)
parameter	c(df = 251)
p.value	1.08313336961588e-157
conf.int	c(-0.0430086397642859, 0.0595042570161475)
estimate	c(`mean of x` = 0.00824780862593065)
null.value	c(mean = 2)
stderr	0.0310466947807715
alternative	two.sided
method	One Sample t-test
data.name	erweitert$Extra_2

ERGEBNIS: p-value = 1.0831334^{-157} = 0.0000… < σ = 0.1 → H₀ verwerfen, Stichprobe gehört NICHT zur Population.

3 Aufgabe 2

Sie möchten jetzt prüfen, ob Soldaten extravertierter als Studenten sind. Führen Sie den t-Test durch und entscheiden Sie bei α = .05. Was sehen Sie in der Ausgabe? Wie lautet der p-Wert, den Sie zum Vergleich heranziehen müssen? Wie lautet die Testentscheidung?

3.1 Datensatz Extra_2 gruppieren

3.2 Gruppen auf Normalverteilung testen

3.2.1 Gruppe SOLDATEN

Shapiro-Wilk-Test für die Gruppe SOLDATEN
statistic	c(W = 0.996212660415187)
p.value	0.993702944346935
method	Shapiro-Wilk normality test
data.name	erweitert.sold$Extra_2

ERGEBNIS SOLDATEN: p-value = 0.9937029 > α = 0,05 → es liegt eine Normalverteilung vor.

3.2.2 Gruppen STUDENTEN

Shapiro-Wilk-Test für die Gruppe STUDENTEN
statistic	c(W = 0.993078230960078)
p.value	0.701714202900116
method	Shapiro-Wilk normality test
data.name	erweitert.stud$Extra_2

ERGEBNIS STUDENTEN: p-value = 0.7017142 > α = 0,05 → es liegt eine Normalverteilung vor.

3.3 Levene-Test zur Überprüfung, ob Varianzhomogenität gegeben ist (𝝈 = 0.05)

Levene-Test zur Überprüfung der Varianzhomogenität
	Df	F value	Pr(>F)
group	1	1.227511	0.2689565
	250	NA	NA

ERGEBNIS Levene-Test: die Signifikanz liegt mit Pr(\>F) = 0.2689565 > 𝝈 = 0.05 also ist von einer Varianzhomogenität auszugehen.

3.4 Zwei-Stichproben-Hypothesentest ungerichtet

H₀: p.value > α = 0.05 Soldaten sind NICHT extravertierter als Studenten

H₁: p.value < α = 0.05 Soldaten sind extravertierter als Studenten

Zwei-Stichproben-Hypothesentest ungerichtet
statistic	c(t = 0.84786341279519)
parameter	c(df = 250)
p.value	0.397325049703262
conf.int	c(-0.070673644742759, 0.177520522133886)
estimate	c(`mean in group 1` = 0.0394114811983426, `mean in group 2` = -0.0140119574972207)
null.value	c(`difference in means between group 1 and group 2` = 0)
stderr	0.0630094870109324
alternative	two.sided
method	Two Sample t-test
data.name	erweitert$Extra_2 by erweitert$Beruf_n

ERGEBNIS t-Test: der p-Wert ist p-value = 0.397325 > α = 0.05 → der Test ist nicht signifikant, H₀ wird nicht verworfen

4 AUFGABE 3

Die Werte in den Spalten „Kaffee” und „Wasser” stellen Extraversions-Scores dar, die unter dem Einfluss von Kaffee und Wasser erhoben worden sind. Sie möchten testen, ob man nach Kaffee-Konsum extravertierter ist als nach Wasser-Konsum. Führen Sie hierfür einen t-Test für abhängige Stichproben durch. Was ist auffällig im Datenblatt im Gegensatz zum t-Test für unabhängige Stichproben? Betrachten Sie die Ausgabe. Wie lautet die Testentscheidung bei α= .05? (Für Voraussetzungen: „Diff” ist der Differenzwert der Messwertpaare Kaffe – Wasser)

4.1 t-test für abhängige Stichproben

4.1.1 Voraussetzungen

4.1.1.1 Liegen metrisch skalierte Variablen für den Mittelwertvergleich vor?

Test auf metrisch skalierte Variable für den Mittelwertvergleich
	Length	Class	Mode
Kaffee	6	summaryDefault	numeric
Wasser	6	summaryDefault	numeric
Diff	6	summaryDefault	numeric

Ergebnis: Kaffee, Wasser und Diff sind numerische Vektoren.

4.1.1.2 Shapiro-Wilk-Test für die Variable erweitert.diff.shap

Die Differenzen zwischen den Beobachtungen der beiden Stichproben sollten im Falle einer kleinen Stichprobe (Daumenregel: Stichprobengröße < 30) einer Normalverteilung folgen.

Shapiro-Wilk-Test Variable erweitert$Diff
statistic	c(W = 0.995680595016814)
p.value	0.709496465080214
method	Shapiro-Wilk normality test
data.name	erweitert$Diff

ERGEBNIS: p-value = 0.7094965 > α = 0,05 → es liegt eine Normalverteilung vor.

4.1.2 t-test

Hypothesen

H₀: Die Reaktionen nach Wasser unterscheiden sich NICHT von denen nach Kaffee.

H₁: Die Reaktionen nach Wasser unterscheiden sich von denen nach Kaffee.

t-test für abhängige Stichproben Variablen erweitert$Kaffee, erweitert$Wasser
statistic	c(t = 125.491420609812)
parameter	c(df = 251)
p.value	1.77888780447344e-228
conf.int	c(73.8698229867891, 76.2254151084489)
estimate	c(`mean of the differences` = 75.0476190476191)
null.value	c(`difference in means` = 0)
stderr	0.598029878719463
alternative	two.sided
method	Paired t-test
data.name	erweitert$Kaffee and erweitert$Wasser

Ergebnis: p.value = 1.7788878^{-228} < α = 0,01. Der Test ist hochsignifikant. H₀ wird verworfen. Die Reaktionen nach Wasser unterscheiden sich von denen nach Kaffee.