Alternativ kannst du die Funktion ggboxplot()
aus der library ggpubr
: Installiere die library zuerst und aktiviere sie dann. Wir lassen uns nun die Arbeitszeit nach Geschlecht ausgeben.
ggbox <- ggboxplot(
pss,
x = "gndr",
y = "wkhtot",
color = "ivory4",
fill = "gndr",
palette = c(
"lightblue",
"pink"
),
ylab = "Total work hours (incl. overtime)",
xlab = "Gender (1:male, 2:female)",
na.rm = TRUE
)
ggbox
Auch hier können wir einfach Feinsteuerungen vornehmen: Wir können zum Beispiel mit einer horizontalen Linie (geom_hline()
) noch den Mittelwert für jede Gruppe einzeichnen.
ggbox +
geom_hline(
aes(
yintercept = mean(
wkhtot[gndr == "male"],
na.rm = TRUE
)
),
lty = 2,
lwd = 1,
color = "lightblue") +
geom_hline(
aes(
yintercept = mean(
wkhtot[gndr == "female"],
na.rm = TRUE
)
),
lty = 2,
lwd = 1,
color = "pink"
) +
theme(legend.position = "none")
Kopiere den Code in dein Skript und probiere verschiedene Zahlenwerte in den Argumenten lwd
und lty
aus.
Als nächstes kannst du dir noch rainclouds
als bessere Visualisierungsmöglichkeit anschauen! Das ist aber freiwillig!