Függelék


Függetlenség vizsgálat

A függetlenség vizsgálata

A szociológusokat mindig is érdekelték azok a kérdések, hogy két vagy több változó között milyen kapcsolat, összefüggés húzódik meg. Annak kimondása, hogy bizonyos változók között lényeges-e ez a kapcsolat vagy sem, nagyon nehéz. Nem lehet matematikai úton megragadni, hogy az összefüggés - a kutatás szempontjából - valóban fontos-e, releváns-e. Viszont a matematikai, statisztikai ismeretek segítségünkre lehetnek abban, hogy megmondják, a megfigyelt összefüggés változóink között adódhat-e pusztán mintavételi hibából vagy sem, illetve milyen valószínűséggel kaphatnánk a megfigyelt eloszlást mintavételi hiba miatt.

Ezt a két gondolati síkot a szociológia módszertana el is választja egymástól. Az elsőt lényegi szignifikanciának, a másodikat pedig statisztikai szignifikanciának nevezte el.

A lényegi szignifikancia problematikájának bemutatása egyrészről egyszerű, másrészről viszont bonyolult - filozófiai, ismeretelméleti problémák világába kellene ellátogatnunk. Az első, vagyis az egyszerűbb utat egy példán keresztül szeretném érzékeltetni. Egy adott felmérésben megkérdezik a mintába bekerült emberektől a következőt: hány rágógumit fogyaszt el egy hét alatt? A kutató szeretné megvizsgálni a nemek közötti különbségeket, ezért ebben a kérdésben is megnézi a nemenkénti átlagokat. Az jön ki, hogy a hölgyek hetente átlagosan 2,19 darabot, az urak pedig 2,21 darabot fogyasztanak el. Mivel elég nagy mintás volt a kutatás, így a t-próba statisztikai szignifikancia szintje elég magas lett, vagyis kicsi (p<0,001) a valószínűsége annak, hogy mintavételi hiba okozná a megfigyelt különbséget. Most jön a “nagy” kérdés, vajon tényleg olyan nagy különbség mutatkozik a rágógumi fogyasztás tekintetében a két nem között? Én erre azt mondom, hogy nem. Ebben az esetben azt írnám le, hogy a nemek szerint bontott eloszlás szempontjából nem különbözik a heti rágógumi fogyasztás mennyisége.

A statisztikai szignifikancia fogalma sokkal egzaktabbul megfogalmazható. Ahhoz, hogy egy mintában szereplő emberek csoportjáról az alapsokaságra vonatkozó becsléseket, megállapításokat tehessünk, azt a feltételt kell teljesítenünk, hogy véletlen mintát vegyünk a megfigyelni kívánt populációból. Ez minden statisztikai és valószínűségszámítási eljárásra épülő módszer alapfeltétele.

Tehát, ha az egyszerűség kedvéért két változó között valamilyen kapcsolatot feltételezünk, akkor érdemes azt megvizsgálni, hogy az adott összefüggés statisztikai értelemben mennyire általánosítható az alapsokaságra. Vagyis, mi annak a valószínűsége, hogy pusztán mintavételi hiba okozta a mintában megfigyelt összefüggést. Úgy is meg lehet fogalmazni, hogy a két változó szempontjából mennyire sikerült reprezentatív mintát vennünk. Ha azt az eredményt kapjuk, hogy a megfigyelt kapcsolat p=0,041 szinten szignifikáns, akkor erről azt mondhatjuk el, hogy ha 1000-szer vettünk volna mintát az alapsokaságból, akkor mindössze 41 esetben kaptunk volna ilyen, vagy ettől extrémebb elrendezést a változók között, vagyis hogy a véletlennek köszönhetõen a populációra nézve ennyiszer nem lett volna elég reprezentatív a mintánk az adott változók szempontjából. Nagyon kicsi a valószínűsége annak, hogy a megfigyelt eloszlást mintavételi hiba okozta volna.

Itt nagyon fontosnak tartok megjegyezni két dolgot. Első, a gyakorlatban nem lehet olyan mintát venni, amely teljes mértékben véletlenül választ ki embereket, azaz hogy mindenki egyforma valószínűséggel kerülhessen be a mintába. Természetesen ez nem jelenti azt, hogy akkor ne is alkalmazzunk statisztikai szignifikanciapróbákat. Véleményem szerint az a legjobb, ha alkalmazzuk őket, de azzal is tisztában kell lennünk, hogy a gyakorlatban megvan a maguk korlátja ezeknek a módszereknek.

Másodszor, minden kutatás tartalmaz nem mintavételi hibát is. A statisztikai eljárások ezekre nem tudnak teszteket végezni. Ezeket a hibákat végig magán fogja hordozni a kutatás. Itt sem kell azért kétségbe esnünk, mert nem vagyunk tökéletesek, mindenki követhet el kisebb hibákat. Az a fontos, hogy ezen hibák minél kisebb voltára törekedjünk.

E rész legvégére egy gondolatot megismételnék. Mindenkit, s ebben magamat is beleértve, szeretnék óvni attól, hogy ha egy összefüggést statisztikailag szignifikánsnak látunk (p=0,00023), akkor azt gondoljuk, hogy jelentős, erős kapcsolat van a két - vagy több - változó között.