Függelék


Statisztikai fogalmak

Statisztika

A statisztika olyan tudományos módszertan, illetve gyakorlati tevékenység, ami arra szolgál, hogy a valóság tényeinek valamely adott körét tömören, a számok nyelvén jellemezze. Az információ kinyerése mint érték jelenik meg, de azzal is számolnunk kell, hogy számos információt el is veszítünk statisztikánkkal.

Alapsokaság, populáció

A vizsgálat tárgyát képező egységek összességét, halmazát statisztikai sokaságnak, vagy rövidebben sokaságnak nevezzük. A sokaság megjelölés helyett gyakran használatos még a populáció elnevezés is.

Minta

Egy adott véges számú sokaságból kiválasztott – véges számú – egységek összessége. A minta elemszáma mindig kisebb, mint maga az alapsokaság. Ha e kettő megegyezik, akkor cenzusról beszélünk (például népszámlálás).

Véletlen minta

A minták egy speciális esete. A véletlen kiválasztás esetében az alapsokaság minden egységéről megmondható, hogy milyen valószínűséggel kerülhet be a mintába. A társadalomkutatás módszertana, azaz a matematikai statisztika a véletlen mintavételre támaszkodik.

Mintavételi hiba

A mintavétel hibája abból adódik, hogy nem a teljes populációt kérdezzük meg, hanem annak csak egy részét. Így információink részlegesek lesznek a teljes alapsokaságról. A mintavételi hiba mértéke szoros összefüggésben van a minta elemszámával, valamint a mintavételi módszerrel. A mintavételi hiba mértéke akkor számolható ki érvényesen, ha véletlen mintát vettünk.

Nem mintavételi hiba

A nem mintavételi hibák az adatfelvételhez kapcsolódnak, nincsenek kapcsolatban sem a mintavétel módszerével, sem a minta elemszámával. Nem mintavételi hibák összetevői az alábbiak lehetnek:

  • a kérdőív hibás megszerkesztése;
  • kérdezőbiztosok munkájának hibái;
  • hibás rögzítés;
  • a mintába bekerült válaszadó félreérthető vagy valós véleményét elfedő válasza, stb.

Gyakoriság

Egy vagy több változó által felvehető értékre, értékekre jutó megfigyelések száma.

Relatív gyakoriság

Ha egy változó által felvehető értékekre jutó megfigyelések számát elosztjuk a teljes mintanagysággal, akkor a relatív gyakorisághoz jutunk. Ezt megtehetjük kettő vagy több változó együttes eloszlása esetében is. A relatív gyakoriság 0 és 1, illetve 1% és 100% közötti értékeket vehet fel. A relatív gyakoriságok összege mindig 1, illetve 100%.

Valószínűség

Azt a számot, amely körül egy esemény relatív gyakorisága ingadozik, az illető esemény valószínűségének nevezzük. Egy esemény bekövetkezésének vagy be nem következésének mértékbeli megadása. A valószínűség, mint mérték 0 és 1 közötti szám.

Változó

Több értéket képes fölvenni, így nem kell egyenként behelyettesítenünk őket például egy függvénybe, hanem elegendő csak a változót. A változónk értékét külön tárolhatjuk, vagy más módon is megadhatjuk – például intervallummal. Természetesen nem csak olyan változók léteznek, melyek számokat vehetnek fel.

Valószínűségi változó

A valószínűségi változó a változók speciális esete. Ebben az esetben meg lehet mondani, hogy a változó milyen valószínűséggel veheti fel értékeit, tehát minden egyes általa fölvehető értékhez hozzá tudunk rendelni egy valószínűséget.

Hipotézis

Hipotéziseknek nevezzük az alapsokaságra vonatkozó küllönféle feltevéseket. A hipotézisek a vizsgált sokaság eloszlására, vagy az adott eloszlás egy vagy több paraméterére vonatkozhatnak.

Egyszerű hipotézis, összetett hipotézis

Egy hipotézist akkor nevezünk egyszerű hipotézisnek, ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Egy összetett hipotézis fennállása végtelen sokféle eloszlást enged meg.

Hipotézisvizsgálat

A hipotézisek helyességének vizsgálatát – mintavételi adatokra támaszkodva – hipotézisvizsgálatnak nevezzük.

Nullhipotézis, alternatív hipotézis (ellenhipotézis)

Minden hipotézisvizsgálatnál két hipotézis fogalmazható meg. A nullhipotézis és az alternatív hipotézis. E kettő közül csak az egyik eset állhat fenn, másként megfogalmazva a két hipotézis egyszerre nem állhat fenn (lásd valószínűség). Hipotézisvizsgálat során mindig a nullhipotézis helyességéről döntünk. Természetesen ez az alternatív hipotézisről való döntést is magában foglalja.

Próbafüggvény

A nullhipotézis fennállásának eldöntését hivatott meghatározni. A próbafüggvény a nullhipotézis fennállását feltételezve, azaz H0 feltétel mellett adja meg az adott valószínűségi változó eloszlását. Ahhoz, hogy a próbafüggvény eloszlása H0 fennállását feltételezve pontosan ismert lehessen, a H0 hipotézisnek egyszerű hipotézisnek kell lennie.

Elfogadási tartomány, elutasítási tartomány

A nullhipotézis helyességéről olyan módon döntünk, hogy a próbafüggvény lehetséges értéktartományának két részre való bontásával hipotézisünk vagy az elfogadási tartományba (nincs okunk elvetni a nullhipotézist), vagy az elutasítási tartományba (elvetjük a nullhipotézist) kerül. Az eseménytérben így két esemény létezi: elfogadási tartomány és elutasítási tartomány. A két tartomány kitölti a teljes eseményteret, és nincs közös területük, azaz diszjunktak.

Küszöbérték

A próbafüggvény lehetséges értéktartományának két részre való bontásának helyét határozza meg. Itt definiálódik, hogy hol lesz a határ az elfogadási tartomány és az elutasítási tartomány között.

Reprezentativitás

Mintákra vonatkozó fogalom. Egy minta bizonyos változók mentén akkor reprezentatív, ha a mintába került elemek (emberek) ugyan olyan arányban vannak jelen, mint az alapsokaságban. Tehát egy minta csak bizonyos szempontok alapján nevezhető reprezentatívnak. Ha más szempontokat veszünk figyelembe, akkor mintánk lehet, hogy nem reprezentatív.

Eloszlás

Valószínűségeloszlás

Egy teljes eseményrendszer valószínűségeinek sorozatát valószínűségeloszlásnak, vagy röviden eloszlásnak nevezzük. Minden megszámlálható, nem negatív p1, p2, … , pn számsorozat, amelyre

Spn=1

valószínűségeloszlásnak tekinthető.

Teljes eseményrendszer

Az A1, A2, … , An esemény teljes eseményrendszert alkot, ha

Ak<>0 (k=1,2, …, n), Aj*Ak=0, ha j¹k és A1+A2+…+An=I.

Egyéb

Egy esemény bekövetkezésének vagy be nem következésének mértékbeli megadása. A klasszikus valószínűségelméletben ez a két eset az eseményteret két részre osztja: vagy bekövetkezik az esemény, vagy nem következik be. A két esemény közül csak az egyik állhat fenn. Mindkét eseményhez rendelhetünk egy számot: legyen ez a szám 1, ha bekövetkezik az esemény, valamint 0 ha nem következik be. Ebből az következik, hogy a valószínűség, mint mérték 0 és 1 közötti szám. Ha a valószínűség nulla, akkor a lehetetlen eseménnyel állunk szemben, ha egy, akkor a biztos eseménnyel. A köztes esetek úgy jönnek létre, hogy többször ismételünk meg egy kísérletet, így vegyesen fordulnak elő a bekövetkező (1), valamint a be nem következő (0) események. Tehát, ha egy esemény bekövetkezésének, illetve be nem következésének arányát szeretnék mérni, akkor többször meg kell vizsgálnunk, ezt az eseményt. A nullák és az egyek összessége fogja adni az eseményteret, az esemény bekövetkezésének valószínűségét pedig az esemnytérben lévő egyesek részesedése adja meg. Azaz elosztjuk az 1 kimenetelű események számát a 0 és 1 kimenetelű események, vagyis az összes esemény számával.