Mediaan betekenis
De mediaan is de waarde welke zich exact in het midden van een dataset bevindt wanneer je ervoor zou kiezen om de waarden van laag naar hoog te rangschikken. Het betreft hier een centrummaat welke zorgt voor een scheiding van de laagste 50 procent van de waarden van de hoogste 50 procent van de waarden. Hoe je de mediaan kan vinden wordt altijd bepaald aan de hand van het aantal waarden in een dataset.
Het bepalen van de mediaan bij een oneven aantal waarden
Bij het berekenen van de mediaan is het van belang om er rekening mee te houden dat er altijd goed moet worden gekeken naar het aantal waarden. Is er sprake van een oneven aantal waarden? Dan zijn er verschillende duidelijke stappen die doorlopen dienen te worden. In dit voorbeeld gaan we even uit van de waarden 350, 800, 220, 500 & 130. Het eerste wat je hierbij moet doen is deze waarden rangschikken van laag naar hoog. Dit betekent dat deze reeks er als volgt komt uit te zien: 130, 220, 350, 500, 800. Vervolgens ga je gebruikmaken van de formule n + 1 : 2. Voor de n geldt dat ze hierbij gelijk staat aan het aantal waarden welke deel uitmaken van je dataset. In dit geval betekent dit 5 + 1 : 2 = 3. De mediaan zal in deze situatie dus de waarde zijn die op de derde plaats is terug te vinden. Dat is dus 350!
Het bepalen van de mediaan bij een even aantal waarden
Is er sprake van een dataset die bestaat uit een even aantal waarden? Dan is er eigenlijk geen sprake van een echt midden. Er bevinden zich in het midden namelijk twee waarden. Dit heeft als gevolg dat de stappen die doorlopen moeten worden om de mediaan te kunnen vinden er enigszins anders uitzien. We maken hierbij gebruik van een voorbeeld dataset bestaande uit in totaal zes waarden. Het betreft hier de volgende: 350, 800, 220, 500, 130, 1150. De eerste stap is vergelijkbaar met deze uit het voorgaande voorbeeld. Ook hierbij moeten alle waarden immers van laag naar hoog worden gerangschikt. Dat betekent dat de dataset er zo komt uit te zien: 130, 220, 350, 500, 800, 1150. Het vinden van de middelste positie doe je in dit voorbeeld door gebruik te maken van de formules n : 2 & n : 2 + 1. Ook hierbij is het zo dat de n gelijk staat aan het aantal waarden die deel uitmaken van de dataset. De middelste waarden bevinden zich hierbij op de derde en vierde plaats. In ons voorbeeld zijn dit dus 350 & 500.
Een laatste extra stap
Met bovenstaande zijn we er natuurlijk nog niet helemaal. We moeten in het voorbeeld van het even aantal woorden namelijk nog altijd de mediaan bepalen. Dit doen we door de beide middelste waarden bij elkaar op te tellen en te delen door 2. In dit voorbeeld wordt dit dus 350 + 500 : 2 = 425. Dit betekent dat de mediaan in dit geval 425 is.
Het bepalen van de mediaan bij ordinale data
In het merendeel van de gevallen is het zo dat de mediaan gebruikt wordt voor zogenaamde kwantitatieve data. Dit betekent dat er sprake is van numerieke waarden. In bepaalde gevallen is het echter zo dat de mediaan ook moet worden bepaald voor ordinale data. Voor ordinale data geldt dat ze verdeeld kan worden over verschillende categorieën met een bepaalde rangorde. Neem nu bijvoorbeeld iemands taalvaardigheid. Hierbij is het mogelijk dat er sprake is van drie verschillende categorieën zoals:
- Beginner;
- Gemiddeld;
- Gevorderd.
Het vinden van de mediaan verloopt in dit geval bijna hetzelfde als bij kwantitatieve data het geval is. In het bovenstaande voorbeeld is het vinden van de mediaan natuurlijk kinderspel, maar wat wanneer er sprake is van zeven verschillende opties of categorieën? Laat ons bijvoorbeeld de reactietijd als voorbeeld nemen. Hiervoor kunnen deze waarden gelden:
- Erg langzaam;
- Langzaam;
- Gemiddeld;
- Een beetje snel;
- Behoorlijk snel;
- Sneller dan gemiddeld;
- Ontzettend snel.
We hebben ze voor de eenvoud al meteen in de juiste volgorde gezet. De formule die hierbij toegepast dient te worden is n + 1 : 2. Voor de n geldt dat ze opnieuw gelijk staat aan het totale aantal waarden die deel uitmaken van de dataset. Voor dit voorbeeld geldt dus concreet dat de formule 7 + 1 : 2 = 4 wordt. De mediaan bevindt zich aldus op de vierde positie.
Wanneer wordt de mediaan gebruikt?
Voor de mediaan geldt dat ze bestempeld wordt als de meest informatieve centrummaat voor een niet normaal verdeelde dataset. Het kan hierbij gaan om bijvoorbeeld scheve verdelingen, maar ook om verdelingen met uitbijters (ook wel outliners genoemd). In het geval van scheve verdelingen is het zo dat er zich beduidend meer waarden aan de ene kant van het centrum bevinden dan aan de andere kant. Het gemiddelde, de zogenaamde mediaan en de modus beschikken allen over een verschillende waarde. Is er sprake van een rechtsscheve verdeling? In dat geval is er sprake van een cluster bestaande uit lagere scores waarbij er zich aan de rechterkant een platte staart bevindt. Is er sprake van een linksscheve verdeling? Dan betreft het een cluster van hogere scores waarbij de platte staart zich niet rechts, maar wel links bevindt.