Analiza danych jest nieodzownym elementem podejmowania właściwych decyzji w wielu dziedzinach. Kluczowym aspektem skutecznej analizy jest umiejętność interpretacji rozkładu danych oraz określania ich centralnej tendencji. Jedną z miar tendencji centralnej, która odgrywa istotną rolę w tym procesie, jest mediana. Choć mniej znana niż średnia arytmetyczna, mediana stanowi niezwykle przydatne narzędzie, szczególnie w przypadku zestawów danych zawierających wartości odstające lub o rozkładzie asymetrycznym.
Definicja mediany
Mediana, określana również jako drugi kwartyl, jest wartością środkową w uporządkowanym rosnąco lub malejąco zbiorze danych. Innymi słowy, mediana dzieli zestaw danych na dwie równe części, gdzie połowa obserwacji ma wartości mniejsze lub równe medianie, a druga połowa – większe lub równe. W zależności od parzystości liczby obserwacji, mediana jest obliczana w następujący sposób:
-
Dla nieparzystej liczby obserwacji: mediana jest środkową wartością po uporządkowaniu danych.
-
Dla parzystej liczby obserwacji: mediana jest średnią arytmetyczną dwóch środkowych wartości po uporządkowaniu danych.
Przykład obliczania mediany
Aby lepiej zrozumieć koncepcję mediany, rozważmy przykład:
Mamy zbiór liczb: 4, 6, 8, 10, 12, 14, 16
Uporządkowane rosnąco: 4, 6, 8, 10, 12, 14, 16
Mediana = 10 (środkowa wartość)