Kurtoza
Kurtoza, pochodząca z greckiego słowa „wydęty”, jest miarą kształtu rozkładu wartości cechy statystycznej. Najczęściej definiuje się ją jako kurtozę nadwyżkową (współczynnik ekscesu), która jest określona wzorem:
gdzie to czwarty moment centralny, a to odchylenie standardowe.
Interpretacja
Kurtoza nadwyżkowa jest bardziej praktyczna, ponieważ:
- Kurtoza normalnego rozkładu wynosi 0.
- Gdy jest sumą niezależnych zmiennych losowych o tym samym rozkładzie, to: .
Kurtoza nie mierzy „spłaszczenia” ani „spiczastości” rozkładu, lecz intensywność wartości skrajnych, co oznacza, że koncentruje się na „ogonach” rozkładu, a nie na jego „czubku”.
Rodzaje rozkładów względem kurtozy
- Mezokurtyczne (KurtE = 0) – intensywność wartości skrajnych jest podobna do rozkładu normalnego.
- Leptokurtyczne (KurtE > 0) – intensywność wartości skrajnych jest większa niż w rozkładzie normalnym.
- Platykurtyczne (KurtE < 0) – intensywność wartości skrajnych jest mniejsza niż w rozkładzie normalnym.
Obliczanie kurtozy
Kurtoza nadwyżkowa z próby oblicza się według wzoru:
gdzie to wartości cechy, to wartość oczekiwana, to odchylenie standardowe, a to liczebność próby. Istnieje również nieobciążony estymator kurtozy.
Kurtoza w rozkładzie normalnym
W rozkładzie normalnym kurtoza wynosi:
Podsumowanie
Kurtoza jest istotnym wskaźnikiem w statystyce, który informuje o intensywności wartości skrajnych w rozkładzie. Rozróżnia się różne typy rozkładów na podstawie wartości kurtozy, co jest kluczowe w analizie danych i wnioskowaniu statystycznym.