Gruppieren

Ebenso können wir Histogramme einer Variable nach Gruppen trennen, wie wir es mit den Balkendiagrammen zuvor gemacht haben. Hierzu nutzen wir die Extra-Funktion facet_grid(), die den Plot teilt, sodass die Grafiken besser zu erkennen sind. In facet_grid() geben wir einfach nur in einer Formel an (x ~ y) nach welcher Variable auf der x-Achse bzw. y-Achse aufgeteilt werden soll. Wir wollen jetzt nur auf der y-Achse nach Geschlecht aufteilen.

histGroup <- ggplot(
  pss,
  aes(
    agea, 
    fill = gndr
  )
) +
  geom_histogram(
    aes(y = ..density..),
    alpha = 0.2
  ) + 
  geom_density(alpha = 0.2) +
  facet_grid(
    .~ gndr
  ) + 
  scale_fill_manual(
    name = "Gender", 
    labels = c(
      "Female", 
      "Male"
    ),
    values = beyonce_palette(72)
  ) +
  labs(
    x = "Age in years", 
    y = "Density", 
    title = "Histogram of Age"
  )

histGroup
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Removed 157 rows containing non-finite outside the scale range
## (`stat_bin()`).
## Warning: Removed 157 rows containing non-finite outside the scale range
## (`stat_density()`).

Anpassungen

Nun verändern wir noch die Beschriftungen über den Histogrammen und entfernen die Legende (weil sonst doppelt!).

histGroup <- ggplot(
  pss,
  aes(
    agea, 
    fill = gndr
  )
) +
  geom_histogram(
    aes(y = ..density..),
    alpha = 0.2, 
    bins = 30, 
    position = "identity"
  ) + 
  geom_density(alpha = 0.2) +
  facet_grid(
    .~ gndr 
  ) + 
  scale_fill_manual(values = beyonce_palette(72)) +
  labs(
    x = "Age in years", 
    y = "Density", 
    title = "Histogram of Age"
  ) + 
  theme(legend.position = "none")

histGroup
## Warning: Removed 157 rows containing non-finite outside the scale range
## (`stat_bin()`).
## Warning: Removed 157 rows containing non-finite outside the scale range
## (`stat_density()`).

Als Alternative kannst du auch ein Ridgeline-Plot erstellen. Mehr dazu auf der nächsten Seite!