Perzentile teilen die Ausprägungen der Variablen in gleich große Gruppen, sodass sich in jeder Gruppe der gleiche Prozentsatz an Werten befindet. Häufig genutzt werden die Quartile (= Viertel, jeweils 25%). Bei Dezilen handelt es sich hingegen um Gruppen von jeweils 10% der Werte.
Quartile teilen die Verteilung in vier gleich große Viertel: 25% der Werte sind kleiner oder gleich groß mit dem 1. Quartil oder unterem Quartil (x~0.25), 50% sind kleiner oder gleich groß wie das 2. Quartil oder mittlere Quartil, das daher gleichzusetzen ist mit dem Median (x~0.5=x~) und 75 % sind kleiner oder gleich groß mit dem 3. Quartil oder obere Quartil (x~0.75).
Quartile werden erst ab einer Stichprobengröße von zumindest 20 (n=20) eingesetzt. Die grundsätzliche Berechnung von Perzentilen ist wie folgt:
Wenn n∗p ganzzahlig:
x~p=21(xn∗p+xn∗p+1)
Wenn n∗p nicht ganzzahlig:
x~p=x⌈n∗p⌉
Für die Quartile, als gängigste Form der Perzentile, ergeben sich folgende Formeln:
Wenn n∗0.75 ganzzahlig:
x~0.75=21(xn∗0.75+xn∗0.75+1))
Wenn n∗0.75 nicht ganzzahlig:
x~0.75=x⌈n∗0.75⌉⌉
Wenn n∗0.25 ganzzahlig:
x~0.75=x⌈n∗0.75⌉
Wenn n∗0.25 nicht ganzzahlig:
x~0.25=x⌈n∗0.25⌉⌉
Das mittlere Quartil ist gleich dem Median:
x~0.5=x~
Dies berechnen wir kurz an einem Beispiel: Wir haben 20 Studierende (n=20) befragt nach der Anzahl der politikwissenschaftlichen Bücher, die sie jeweils besitzen.
Für die Berechnung eines Perzentils, bzw. im genaueren Fall eines Quartils, müssen die Daten immer in eine geordnete Reihe gesetzt werden:
1,3,4,4,5,5,7,7,7,9,9,11,12,17,18,18,24,24,31,31
x1,x2,x3,x.4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16,x17,x18,x19,x20
Um nun zu wissen, welche Formel wir für die Quartile berechnen müssen, müssen wir zuerst n∗p berechnen.
0.25∗20=5
0.5∗20=10
0.75∗20=15
Wir erhalten in allen Fällen ganzzahlige Ergebnisse, daher werden die Quartile wie folgt berechnet:
x~0.75=21(xn∗0.75+xn∗0.75+1)
x~0.25=21(xn∗0.25+xn∗0.25+1)
Für das dritte Quartil (75%) ergibt sich daher:
x~0.75=21(xn∗0.75+xn∗0.75+1)=21∗(x15+x16)
An der 15. bzw. 16. Stellen der geordneten Datenreihe ist: x15=18 und x16=18
x~0.75=21∗(x15+x16)=21∗(18+18)=18
Das obere Quartil hat daher den Wert 18 (x~0.75=18).
Für das untere Quartil ergibt sich ebenso:
x~0.25=21(x20∗0.25+x20∗0.25+1)=21∗(x5+x6)
An der 5. bzw. 6. Stellen der geordneten Datenreihe ist: x5=5 und x6=5
x~0.25=21∗(x5+x6)=21∗(5+5)=5
Der Wert des unteren Quartils ist daher 5 (x~0.25=5).
25% der Werte des Merkmals Anzahl politikwissenschaftlicher Bücher sind kleiner/gleich 5 und 75% der Werte des Merkmals sind kleiner/gleich 18.
Bei ungeradem Wert von n∗p wird - entsprechend der Formel - der Wert aufgerundet.
Wenn wir nur 18 Beobachtungen hätten, wäre n∗p=18∗0.75=13.5 bzw. 18∗0.25=4.5.
Das obere Quartil wäre daher x~0.75=x⌈13.5⌉=x14 bzw. das untere Quartil wäre x~0.25=x⌈4.5⌉=x5.
Siehe auch: Gehring & Weins (2009, pp. 132–135).