Függelék


Yates-féle korrigált statisztika

Miért és mikor javasolt a Yates-féle korrigált statisztika használata?

Yates azt vette észre, hogy 2×2-es eloszlások esetében, ha valamelyik cellában nulla vagy nagyon kicsi a relatív gyakoriság, akkor a khi-négyzet teszt nem ad jó eredményt a függetlenségi nullhipotézis vizsgálatakor. Véleménye szerint a khi-négyzet próba ilyen esetekben hajlamosabb elvetni a függetlenség hipotézisét.

Üres vagy kis esetszámú cellákkal több esetben találkozhatunk munkánk során.

Alapvetően két részre oszhatjuk az okát annak, hogy miért lett egy kereszttábla valamelyik cellája üres, azaz a megfigyelések száma nullával egyenlő.

1. Strukturális oka van az üres cellának (röviden: strukturális nulla).

Egy adott kombináció nem létezik a populációban. Például olyan kérdések is szerepelnek egy kutatásban, melyekre csak nők tudnak választ adni.

2. Véletlen oka van annak, hogy nincs megfigyelésünk egy adott cellában (röviden: véletlen nulla).

2.a Kis mintán dolgozunk

Ebben az esetben könnyen adódhatnak olyan helyzetek, amikor már egy 2×2-es táblában sem lesz mindegyik cellában megfigyelés. A minta nagyságának statisztikailag indokolt mértékét bizony nem minden esetben tudjuk betartani. Ok lehet az anyagi korlát, valamint a lekérdezhető emberek kis száma.

2.b Nagy, illetve többdimenziós kereszttáblát használunk

Könnyű belátni, ha egy N elemszámú mintát túlzottan sok cellába szeretnénk elosztani, akkor elkerülhetetlen az üres cellák megjelenése. Különösen, ha valamelyik eloszlás erősen eltér az egyenletestől.

2.c Kevesen válaszoltak egy adott kérdésre

Feltételes kérdéseknél szokott előfordulni, ugyanis ilyenkor gyakran átugorják ezt az itemet. Lehet oka az is, hogy a terület, amivel kapcsolatban véleményt szeretnénk gyűjteni, túl kényes, diszkrét.

 

Yates-féle korrigált statisztika

 

A Yates-féle korrigált statisztika kiszámításának módja nagyon hasonlít jellegében a khi-négyzet statisztikához. A különbség a számlálóban mutatkozik meg.

kk2.gif

A tapasztalati és az elméleti független eloszlás cellagyakoriság különbségeinek abszolút értékéből le kell vonni felet, majd ezt négyzetre emelni. Ezen lépés után, már megegyeznek a lépések a khi-négyzet statisztika számításával. Osztani kell az elméleti független eloszlás megfelelő gyakoriságával a számlálót. Majd ezt az egész műveletsorozatot elvégezni mind a négy cellára. Ha összeadjuk a négy számot, akkor megkapjuk a Yates-féle statisztika értékét. Ezek után a szignifikanciapróba menete teljesen megegyező a khi-négyzet próbáéval. A statisztika értékét össze kell hasonlítani a khi-négyzet eloszlás táblázatbeli értékével. Ha a statisztika értéke a küszöbérték alatt van, akkor nincs okunk elvetni azt a hipotézist (H0), hogy a két változó független egymástól. Amennyiben a statisztika értéke megegyezik, vagy nagyobb a táblázatbeli értéknél, el kell utasítanunk a (H0) nullhipotézist, ekkor nincs okunk elutasítani (H1) alternatív hipotézist.

Első ránézésre azt gondolnánk, hogy a Yates-féle statisztika számláló beli értéke mindig kisebb lesz a khi-négyzet statisztika számlálójának értékénél. Vannak olyan eloszlások, melyek esetében fordított a helyzet. Amennyiben a tapasztalt és a várt gyakoriság különbsége kisebb ¼-nél (abszolút értékben), a Yates-féle statisztika számlálójában nagyobb érték fog adódni, mint a khi-négyzet statisztikáéban.