Reklama
Dzisiaj jest 9 stycznia 2025 r.
Chcę dodać własny artykuł
Reklama
Reklama
Reklama

Test chi-kwadrat

Test chi-kwadrat \left(\chi^2\right) – każdy test statystyczny, w którym statystyka testowa ma rozkład chi kwadrat. Test chi-kwadrat służy weryfikacji hipotez mówiących o niezależności zmiennych lub zgodności rozkładu z założeniami. Wyróżnia się między innymi test zgodności chi-kwadrat (ang. goodness-of-fit chi-squared test), test chi-kwadrat niezależności (ang. independence) i test jednorodności (ang. homogeneity) chi-kwadrat.

Reklama

Test Pearsona

W ogólności zachodzi:
:: \chi^2=\sum_{i=1}^n \left( \frac{O_i-E_i}{\sigma_i} \right)^2
gdzie:
: O_i – wartość mierzona,
: E_i – wartość teoretyczna (oczekiwana) wynikająca z hipotezy odpowiadająca wartości mierzonej,
: \sigma_i – odchylenie standardowe,
: n – liczba pomiarów.

Zliczenia

W szczególności, gdy wartościami są zliczenia, wtedy ich odchylenie standardowe wynosi \sqrt{E_i} i równanie przechodzi na:
:: \chi^2=\sum_{i=1}^n\frac{(O_i{-}E_i)^2}{E_i}
Uwagi:
* Przyjmuje się, że wartość E_i powinna być większa lub równa 5 (spotyka się też 10 – nie ma ścisłego wyprowadzenia minimalnej wielkości).
** Czasem z tego powodu przy pomiarach wartości dyskretnych łączy się te wartości w jeden przedział (patrz przykład).
* Przy pomiarze wartości ciągłej wartość teoretyczna to całka z rozkładu prawdopodobieństwa po odpowiednim przedziale z którego zliczane były wyniki.
:: Przykład
Rozpatrzmy rzut pięcioma kośćmi i liczbę wyrzuconych szóstek k. Może ona przyjmować wartości 0,1,2,3,4,5, nie widać więc potrzeby dzielenia tych wielkości na przedziały. Rzut został powtórzony 200 razy, wartości teoretyczne dla takiej liczby rzutów przedstawione są w tabeli, w kolumnie E_k. Widać, że dla k=4,5 są to wartości bardzo małe, dlatego też należy stworzyć nowe przedziały, tak aby w każdym wartość teoretyczna była większa od 5. Przedstawione jest to w tabeli, oznaczone są one przez n
Mając dane z rzutów można obliczyć ich zgodność z rozkładem teoretycznym (tutaj jest to rozkład dwumianowy b_{5,\frac{1}{6}}(k)). W praktyce byłby to test kości na to, jak dobrze jest wyważona.

Reklama

Sprawdzanie zależności dwu mierzonych wartości

Mając dwie serie pomiarów x_i i y_i, a także teoretyczną zależność y=f(x), można określić dzięki testowi chi-kwadrat na ile ta zależność pasuje do danych doświadczalnych. Przyjmując, że wartość błędu x jest zaniedbywalna i \sigma_i jako błąd wartości y_i
:: \chi^2=\sum_{i=1}^n\left(\frac{y_i-f(x_i)}{\sigma_i}\right)^2.

Normalizacja

Wartość zredukowanego testu chi-kwadrat wynosi
:: \widehat{\chi^2}=\frac{1}{d}\chi^2,
:: d=n-c-1  – liczba stopni swobody,
gdzie c to liczba parametrów modelu teoretycznego szacowanych na podstawie danych pomiarowych. Może to być np. średnia, dyspersja, parametr funkcji f(x) czy całkowita liczba pomiarów. Można udowodnić, że nieznormalizowany test chi-kwadrat ma oczekiwaną wartość d, zatem test unormowany powinien wynosić 1. Widać także, że liczba pomiarów powinna być większa od liczby szacowanych parametrów. Okazuje się, że za pomocą testu chi-kwadrat można potwierdzić każdą teorię o dostatecznie dużej liczbie parametrów.
W poprzednim przykładzie, aby obliczyć wartość oczekiwaną należy pomnożyć rozkład przez liczbę rzutów, przyjąć c = 0 (nie szacujemy żadnych parametrów modelu); wtedy d=4-0-1=3.

Interpretacja

Otrzymaną wartość znormalizowanego testu ocenia się za pomocą rozkładu chi kwadrat. Polega to na obliczeniu prawdopodobieństwa otrzymania wartości testu równej lub większej, niż otrzymanej przez nas. Ponieważ takie obliczenia są dość skomplikowane, najczęściej korzysta się z danych zamieszczonych w odpowiednich tablicach.
Mając odpowiednie prawdopodobieństwo, należy określić jego najmniejszą wartość, dla której jesteśmy w stanie zaakceptować hipotezę jako prawdę. Przyjmuje się te wartości różnie. Okazuje się, że zbyt duże prawdopodobieństwo także świadczy o złym wyniku (lub o wyniku nieuczciwym). Wynika to z faktu, że dane podlegają pewnemu rozkładowi, więc bardzo mało prawdopodobne jest, aby wszystkie otrzymane wyniki tak dobrze pasowały do modelu teoretycznego.

Zastosowania

Test \chi^2 jest najważniejszym testem nieparametrycznym. Znajduje zastosowania w rachunku błędu pomiarowego w naukach przyrodniczych, technicznych i naukach społecznych. Jest to jeden z najczęściej stosowanych w naukach społecznych testów istotności statystycznej.

Przypisy

Bibliografia

* John R. Taylor, Wstęp do analizy błędu pomiarowego.

Linki zewnętrzne

* [http://www.fourmilab.ch/rpkp/experiments/analysis/chiCalc.html Kalkulator chi-kwadrat wraz z przystępnym opisem (ang.)]
* [http://statystyka-pomoc.com/Chi-kwadrat.html Przystępne wyjaśnienie użycia testu chi-kwadrat]
chi-kwadrat
Kategoria:Statystyka nieparametryczna

Reklama
Reklama