Függelék


chi-négyzet próba

Khi-négyzet szignifikanciapróba

A konkrét szignifikanciapróba két hipotézisen alapul. Ezeket a hipotéziseket nullhipotézisnek, illetve alternatív hipotézisnek nevezzük. A két hipotézis közül csak az egyik állhat fenn. A próbának az a feladata, hogy döntést hozzon valamelyik hipotézis mellett.

H0 legyen a következő: két változó független egymástól, azaz Pij=Pi.*P.j .

H1 pedig a következő: a két változó nem független egymástól, azaz Pij<>Pi.*P.j .

k1.gif

k2.gifk3.gif

Driszkrét eloszlású változók esetében khi-négyzet próbát szoktunk alkalmazni a fenti nullhipotézis tesztelésére.

A teszt azt nézi meg, hogy a mért kétdimenziós eloszlás milyen távol van a kiszámított független kétdimenziós eloszlástól. A függetlenség vizsgálata az illeszkedés vizsgálat speciális esete. A kérdés így is megfogalmazható: illeszkedik-e az empirikus eloszlás a kiszámított független eloszláshoz?

k4.gif

A független kétdimenziós eloszlás megállapításának módja

A két változó ismert egydimenziós eloszlásai fogják adni a kétdimenziós eloszlás marginálisait, mind az empirikusan mért eloszlás, mind a kiszámolt független eloszlás esetében.

k5.gifk6.gif

k7.gif

k8.gif

A független eloszlásnál annak a feltételnek kell teljesülnie, hogy a megfelelő marginálisok valószínűségeinek szorzata megegyezzen a kétdimenziós cellák valószínűségeivel.

 

A khi-négyzet statisztika kiszámítása

Ki kell vonni az [1,1] cella empirikus gyakoriságát (f11)az elméleti független eloszlás [1,1] cellájának gyakoriságából (e11). A különbség értékét négyzetre kell emelni, majd el kell osztani ezt a számot az elméleti független eloszlás [1,1] cella gyakoriságával (e11). Ezt el kell végezni mind a négy cella esetében, majd ezen számokat össze kell adni. Ez az összeg a khi-négyzet statisztika értéke.

k9.gif

A khi-négyzet próba

A khi-négyzet statisztika értékét össze kell vetni az elméleti (táblázat beli) khi-négyzet eloszlás megfelelő értékével. Egy 2×2-es kereszttábla esetében szabadságfok=1, [szabadságfok=(kerszttábla sorainank száma-1)*(kereszttábla oszlopainak száma-1)], valamint 5%-os hibahatár mellett ez az elméleti érték 3,841. Ha a statisztika értéke 3,841 alatt van, akkor nincs okunk elvetni a nullhipotézist (H0). Amennyiben 3,841 - vagy e fölötti az érték - elvetjük a nullhipotézist (H0).