Macierz korelacji
Macierz korelacji to narzędzie statystyczne, które zawiera współczynniki korelacji dla par zmiennych losowych. Jest kluczowym elementem w analizie danych, zwłaszcza w kontekście analizy czynnikowej.
Własności macierzy korelacji
Macierz korelacji spełnia pięć istotnych kryteriów:
- Jest macierzą kwadratową.
- Elementy macierzy mieszczą się w przedziale < -1, 1 >.
- Wszystkie elementy na głównej przekątnej są równe 1.
- Macierz jest symetryczna.
- Wyznacznik macierzy znajduje się w przedziale < 0, 1 >.
Wyznacznik macierzy korelacji jest wskaźnikiem współliniowości zmiennych objaśniających. Wartości bliskie 1 wskazują na niski stopień skorelowania, natomiast wartości bliskie 0 sugerują silną korelację. Niska wartość wyznacznika może sugerować złe dobranie zmiennych objaśniających, co może wymagać modyfikacji modelu poprzez eliminację zmiennych współliniowych.
Wpływ silnej korelacji na estymatory
Silna korelacja między zmiennymi objaśniającymi negatywnie wpływa na efektywność estymatorów parametrów modelu. Dlatego ważne jest, aby w przypadku wystąpienia silnych zależności, przeanalizować i dostosować model.
Przykład macierzy korelacji
Dla zbioru zmiennych losowych X1, X2, …, Xn, przykładowa macierz korelacji dla trzech zmiennych może przedstawiać się następująco:
Na przecięciu wiersza i kolumny dla zmiennych X2 i X3 można odczytać, że współczynnik korelacji wynosi 0,41.
Rola w analizie czynnikowej
Budowa macierzy korelacji jest zazwyczaj pierwszym krokiem w analizie czynnikowej, gdzie często analizowane są macierze z przeciętnymi współczynnikami korelacji przekraczającymi 0,3.