ggboxplot()

Alternativ kannst du die Funktion ggboxplot() aus der library ggpubr: Installiere die library zuerst und aktiviere sie dann. Wir lassen uns nun die Arbeitszeit nach Geschlecht ausgeben.

ggbox <- ggboxplot(
  pss,
  x = "gndr",              
  y = "wkhtot",             
  color = "ivory4",
  fill = "gndr",
  palette = c(
    "lightblue", 
    "pink"
  ),
  ylab = "Total work hours (incl. overtime)",
  xlab = "Gender (1:male, 2:female)",
  na.rm = TRUE
) 

ggbox

Auch hier können wir einfach Feinsteuerungen vornehmen: Wir können zum Beispiel mit einer horizontalen Linie (geom_hline()) noch den Mittelwert für jede Gruppe einzeichnen.

ggbox +
  geom_hline(
    aes(
      yintercept = mean(
        wkhtot[gndr == "male"], 
        na.rm = TRUE
      )
    ),
    lty = 2,
    lwd = 1,
    color = "lightblue") + 
  geom_hline(
    aes(
      yintercept = mean(
        wkhtot[gndr == "female"], 
        na.rm = TRUE
      )
    ),
    lty = 2,
    lwd = 1, 
    color = "pink"
  ) +
  theme(legend.position = "none")

Kopiere den Code in dein Skript und probiere verschiedene Zahlenwerte in den Argumenten lwd und lty aus.

Wofür stehen die Argumente lwd und lty?

Als nächstes kannst du dir noch rainclouds als bessere Visualisierungsmöglichkeit anschauen! Das ist aber freiwillig!