ggboxplot()

Como alternativa, você pode usar a função ggboxplot() da biblioteca ggpubr: Primeiro, instale a biblioteca e então a ative. Agora vamos exibir o tempo de trabalho por gênero.

ggbox <- ggboxplot(
  pss,
  x = "gndr",              
  y = "wkhtot",             
  color = "ivory4",
  fill = "gndr",
  palette = c(
    "lightblue", 
    "pink"
  ),
  ylab = "Total work hours (incl. overtime)",
  xlab = "Gender (1:male, 2:female)",
  na.rm = TRUE
) 

ggbox

Aqui também podemos fazer ajustes finos facilmente: Por exemplo, podemos adicionar a média de cada grupo com uma linha horizontal (geom_hline()).

ggbox +
  geom_hline(
    aes(
      yintercept = mean(
        wkhtot[gndr == "male"], 
        na.rm = TRUE
      )
    ),
    lty = 2,
    lwd = 1,
    color = "lightblue") + 
  geom_hline(
    aes(
      yintercept = mean(
        wkhtot[gndr == "female"], 
        na.rm = TRUE
      )
    ),
    lty = 2,
    lwd = 1, 
    color = "pink"
  ) +
  theme(legend.position = "none")

Copie o código para o seu script e experimente diferentes valores numéricos nos argumentos lwd e lty.

O que significam os argumentos lwd e lty?

Em seguida, você pode dar uma olhada nos rainclouds como uma opção de visualização melhor! Mas isso é opcional!