Chi kvadrato (χ2) statistinis apibrėžimas
Kas yra „Chi Square“ statistika?Chi kvadratas ( χ 2 ) statistika yra testas, kuriuo matuojamas lūkesčių palyginimas su faktiškai stebimais duomenimis (arba modelio rezultatais). Duomenys, naudojami apskaičiuojant chi kvadrato statistiką, turi būti atsitiktiniai, neapdoroti, vienas kitą paneigiantys, paimti iš nepriklausomų kintamųjų ir paimti iš pakankamai didelės imties. Pavyzdžiui, mesti monetą 100 kartų rezultatai atitinka šiuos kriterijus.
Chi kvadrato testai dažnai naudojami atliekant hipotezės testus.
Chi aikštės formulė yra
χc2 = ∑ (Oi − Ei) 2Ei kur: c = laisvės laipsniaiO = stebima vertė (-os) E = laukiama reikšmė (-ės) \ prasideda {suderinta} & \ chi ^ 2_c = \ suma \ fraka {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {kur:} \\ & c = \ tekstas {laisvės laipsniai} \\ & O = \ tekstas {stebima reikšmė (-ės)} \\ & E = \ tekstas {laukiama reikšmė (-ės) )} \\ \ pabaiga {suderinta} χc2 = ∑Ei (Oi −Ei) 2, kur: c = laisvės laipsniaiO = stebima vertė (-os) E = laukiama vertė (-os)
Ką jums sako „Chi Square“ statistika?
Yra du pagrindiniai chi kvadrato testų tipai: nepriklausomybės testas, kuriame užduodamas santykių klausimas, pavyzdžiui, „Ar yra ryšys tarp lyties ir SAT balų?“; ir tinkamumo testas, kuriame užduodamas kažkas panašaus į klausimą: „Jei moneta bus išmesta 100 kartų, ar ji pasuks 50 kartų, o uodegos 50 kartų?“
Šiems bandymams naudojami laisvės laipsniai, siekiant nustatyti, ar tam tikrą nulinę hipotezę galima atmesti remiantis visu kintamųjų ir mėginių skaičiumi eksperimente.
Pvz., Svarstant studentų pasirinkimą ir kurso pasirinkimą, 30 ar 40 studentų imties dydis nėra pakankamai didelis, kad būtų galima sukaupti reikšmingų duomenų. Gauti tokie patys ar panašūs tyrimo rezultatai, naudojant 400 ar 500 studentų imtį, yra teisingiau.
Kitame pavyzdyje apsvarstykite galimybę mesti monetą 100 kartų. Tikėtinas 100 monetų išmetimo rezultatas yra tai, kad galvos pakils 50 kartų, o uodegos - 50 kartų. Tikrasis rezultatas gali būti toks, kad galvos kyla 45 kartus, o uodegos - 55 kartus. Chi kvadrato statistika parodo bet kokius neatitikimus tarp laukiamų ir faktinių rezultatų.
Pagrindiniai išvežamieji daiktai
- Chi kvadratas (χ 2 ) statistika yra testas, kuriuo matuojamas lūkesčių palyginimas su faktiškai stebimais duomenimis.
- Yra du pagrindiniai chi kvadrato testai: duomenų nepriklausomumo testas ir modelio tinkamumo testai.
- Šie testai gali būti naudojami norint nustatyti, ar atliekant hipotezės patikrinimą galima atmesti tam tikrą niekinę hipotezę.
Chi kvadrato testo pavyzdys
Įsivaizduokite, atsitiktinė apklausa buvo atliekama 2000 skirtingų rinkėjų - tiek vyrų, tiek moterų. Žmonės, kurie atsakė, buvo suskirstyti pagal lytį ir tai, ar jie yra respublikonai, demokratai, ar nepriklausomi. Įsivaizduokite tinklelį su stulpeliais, pažymėtais respublikiniais, demokratais ir nepriklausomais, ir dviem eilutėmis, pažymėtomis vyrišku ir moterišku. Tarkime, kad 2000 respondentų duomenys yra šie:
Respublikonas | Demokratas | Nepriklausomas | Iš viso | |
Patinas | 400 | 300 | 100 | 800 |
Moteris | 500 | 600 | 100 | 1200 |
Iš viso | 900 | 900 | 200 | 2000 m |
Pirmasis žingsnis apskaičiuojant chi kvadrato statistiką - surasti numatomus dažnius. Jie apskaičiuojami kiekvienam tinklelio „langeliui“. Kadangi yra dvi lyties ir trys politinio požiūrio kategorijos, numatomi šeši dažniai. Tikėtino dažnio formulė:
E (r, c) = n (r) × c (r) n kur: r = kyste eilutė = klausimo stulpelis = atitinkama bendra \ pradžia {suderinta} ir E (r, c) = \ frakas {n (r) \ kartų c (r)} {n} \\ & \ textbf {kur:} \\ & r = \ tekstas {atitinkama eilutė} \\ & c = \ tekstas {nagrinėjama skiltis} \\ & n = \ tekstas {atitinkama bendra suma } \\ \ pabaiga {išlyginta} E (r, c) = nn (r) × c (r) kur: r = kyste eilutė = klausimo stulpelis = atitinkama bendra
Šiame pavyzdyje numatomi dažniai:
- E (1, 1) = (900 x 800) / 2 000 = 360
- E (1, 2) = (900 x 800) / 2 000 = 360
- E (1, 3) = (200 x 800) / 2 000 = 80
- E (2, 1) = (900 x 1 200) / 2 000 = 540
- E (2, 2) = (900 x 1 200) / 2 000 = 540
- E (2, 3) = (200 x 1 200) / 2 000 = 120
Toliau tai yra naudojamos vertės apskaičiuojant chi kvadrato statistiką pagal šią formulę:
Chi-kvadratas = ∑ [O (r, c) −E (r, c)] 2E (r, c) kur: O (r, c) = stebimi duotos eilutės ir stulpelio duomenys \ prasideda {suderinta} & \ tekstas {Kvadratas} = \ suma \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kur:} \\ & O (r, c) = \ tekstas {stebimi nurodytos eilutės ir stulpelio duomenys} \\ \ pabaiga {suderinta} Chi-kvadratu = ∑E (r, c) [O (r, c) −E (r, c)] 2, kur: O (r, c) = stebimi duomenys apie nurodytą eilutę ir stulpelį
Šiame pavyzdyje kiekvienos stebimos vertės išraiška yra:
- O (1, 1) = (400 - 360) 2/360 = 4, 44
- O (1, 2) = (300 - 360) 2/360 = 10
- O (1, 3) = (100 - 80) 2/80 = 5
- O (2, 1) = (500 - 540) 2/540 = 2, 96
- O (2, 2) = (600 - 540) 2/540 = 6, 67
- O (2, 3) = (100 - 120) 2/120 = 3, 33
Chi kvadrato statistika lygi šių verčių sumai arba 32, 41. Tada galime pažvelgti į chi kvadrato formos statistikos lentelę, kad pamatytume, atsižvelgiant į mūsų laisvės laipsnius, jei rezultatas yra statistiškai reikšmingas, ar ne.
Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.