Der Median gibt die Mitte einer Verteilung an. Außerdem brauchst du ihn, wenn du Boxplots zeichnen möchtest. Er kann für alle Merkmale berechnet werden, die mindestens auf Ordinalskalenniveau gemessen werden. Wir erklären dir hier, wie das geht und wie du den Median interpretierst.

Wozu brauchst du den Median?

Verteilungen, die du beispielsweise aus einer Datenerhebung erhältst, sind auf einen Blick oft nicht leicht zu verstehen. Vor allem, wenn du zwei unterschiedliche Verteilungen mit denselben Merkmalen miteinander vergleichen willst, hilft es dir, wenn du dafür einzelne statistische Kennzahlen heranziehst.

Nimm zum Beispiel an, du möchtest die Mathe-Noten in deiner Klasse (a) und in deiner Parallelklasse (b) miteinander vergleichen, weil du glaubst, dass deine Parallelklasse es in Mathe leichter hat. Immerhin schreiben dort viel mehr Schüler und Schülerinnen Einsen und Zweien. Du erhältst die beiden folgenden Notenspiegel zum Vergleich:

Für sich genommen ist es schwierig, zu sagen, welche Klasse besser abschneidet. In Klasse b gibt es zwar mehr Einsen und Zweien, aber auch mehr Vieren, dafür aber gar keine Sechs.

Um solche Verteilungen miteinander zu vergleichen, benötigt man statistische Kennwerte. Üblicherweise wird bei Schulnoten das arithmetische Mittel gebildet, indem alle einzelnen Noten addiert und durch die Anzahl der Noten geteilt werden. Das machen wir hier nicht,  weil es statistisch gesehen falsch ist. Denn Schulnoten sind ordinalskaliert, das heißt, du kannst sie zwar in eine Rangfolge bringen, aber nicht mit ihnen rechnen, denn der Abstand zwischen einer 1 und einer 2 ist nicht derselbe wie der zwischen einer 4 und einer 5.

Tipp: Alles Wissenswerte über Skalenniveaus findest du in diesem Artikel.

Interpretation

Auch für ordinal skalierte Merkmale wie Schulnoten gibt es statistische Kennwerte wie zum Beispiel den Median. Er ist der mittlere Wert einer Verteilung, also der Wert, der die Menge aller Daten in zwei gleich große Teile trennt. Die Hälfte aller Werte liegt dann unter dem Median und die andere Hälfte liegt über dem Median.

Wenn du den Median der beiden Schulnoten-Verteilungen kennst, weißt du also, dass die Hälfte aller Schüler eine bessere und die andere Hälfte eine schlechtere Note hat. Der Median hilft dir also dabei, zu verstehen, welche Note in der Mitte aller Noten liegt. Deswgen nennt man den Median manchmal auch Zentralwert.

Eigenschaften des Median

Der Median liegt genau in der Mitte einer Verteilung. Das bringt einen großen Vorteil mit sich: Der Median ist immun gegen Ausreißer. Egal, ob einzelne Schüler und Schülerinnen sehr gute oder sehr schlechte Noten haben: Wenn die meisten schlechter als 4 sind, ist der Median eine 4. Das arithmetische Mittel dagegen berechnet Ausreißer vollständig ein.

Bei Schulnoten ist dies noch nicht so relevant, da es nur 6 verschiedene gibt und Ausreißer daher nicht so gravierend sind. Aber anhand eines anderen Beispiels kannst du es gut feststellen. Wir wählen hierfür ein metrisch skaliertes Merkmal, die Körpergröße, damit wir auch das arithmetische Mittel berechnen können. Stelle dir vor, du kennst drei Fünfzehnjährige, deren Größe du ermittelt hast. Die Werte sind (bereits sortiert) 1,69 m, 1,72 m und 1,91 m. Der dritte Wert ist offensichtlich ein Ausreißer. Für den Median ist dies egal. Der Wert, der in der Mitte liegt, ist 1,72 m. Das arithmetische Mittel ist jedoch 1,77 m und wird durch den Ausreißer stark nach oben gezogen.

Wie du den Median berechnest

Um den Median zu berechnen, ordnest du alle Daten einzeln aufsteigend. Das bedeuet, dass du nicht einfach die Verteilung zugrunde legen kannst, sondern wirklich alle einzelnen Werte aufschreiben musst. Für Klasse a sieht dies folgendermaßen aus:

Klasse a
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
5
5
5
5
5
6
6

 

Insgesamt sind dies 31 Noten. Man sagt auch n = 31, wobei n die Anzahl der Werte ist. Der Wert, der in der Mitte liegt, ist also der 16. Welchen Wert du nehmen musst, kannst du errechnen, indem du

  • bei ungeradem n:
    n – 1 ausrechnest, dann durch 2 teilst und schließlich wieder 1 addierst, also (31 -1) / 2 + 1 = 16
  • bei geradem n:
    n durch 2 teilst und diesen sowie den darauffolgenden Wert nimmst und aus beiden das arithmetische Mittel bildest.

Im obigen Beispiel haben wir eine ungerade Anzahl an Daten. Also müssen wir einfach den 16. Wert abzählen. Dies ist eine 3.

Die Verteilung für Klasse b sieht so aus:

Klasse b
1
1
1
1
1
1
1
2
2
2
2
2
2
2
3
3
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
5

 

Insgesamt hat diese Verteilung 32 Werte. Das bedeutet, es gibt keinen einzelnen Wert, der exakt in der Mitte liegt. In diesem Fall behilft man sich, indem man die beiden mittleren Werte (Wert 16 und Wert 17) herausfindet, sie miteinander addiert und durch 2 teilt. Wert 16 ist hier eine 3, Wert 17 eine 4, der Median beträgt also (3 + 4) / 2 = 7 / 2 = 3,5. Obwohl es deutlich mehr sehr gute und gute Noten in Klasse b gibt, ist der Median hier also schlechter.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.