Pagrindinis » verslo vadovai » Chi kvadrato (χ2) statistinis apibrėžimas

Chi kvadrato (χ2) statistinis apibrėžimas

verslo vadovai : Chi kvadrato (χ2) statistinis apibrėžimas
Kas yra „Chi Square“ statistika?

Chi kvadratas ( χ 2 ) statistika yra testas, kuriuo matuojamas lūkesčių palyginimas su faktiškai stebimais duomenimis (arba modelio rezultatais). Duomenys, naudojami apskaičiuojant chi kvadrato statistiką, turi būti atsitiktiniai, neapdoroti, vienas kitą paneigiantys, paimti iš nepriklausomų kintamųjų ir paimti iš pakankamai didelės imties. Pavyzdžiui, mesti monetą 100 kartų rezultatai atitinka šiuos kriterijus.

Chi kvadrato testai dažnai naudojami atliekant hipotezės testus.

Chi aikštės formulė yra

χc2 = ∑ (Oi − Ei) 2Ei kur: c = laisvės laipsniaiO = stebima vertė (-os) E = laukiama reikšmė (-ės) \ prasideda {suderinta} & \ chi ^ 2_c = \ suma \ fraka {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {kur:} \\ & c = \ tekstas {laisvės laipsniai} \\ & O = \ tekstas {stebima reikšmė (-ės)} \\ & E ​​= \ tekstas {laukiama reikšmė (-ės) )} \\ \ pabaiga {suderinta} χc2 = ∑Ei (Oi −Ei) 2, kur: c = laisvės laipsniaiO = stebima vertė (-os) E = laukiama vertė (-os)

Ką jums sako „Chi Square“ statistika?

Yra du pagrindiniai chi kvadrato testų tipai: nepriklausomybės testas, kuriame užduodamas santykių klausimas, pavyzdžiui, „Ar yra ryšys tarp lyties ir SAT balų?“; ir tinkamumo testas, kuriame užduodamas kažkas panašaus į klausimą: „Jei moneta bus išmesta 100 kartų, ar ji pasuks 50 kartų, o uodegos 50 kartų?“

Šiems bandymams naudojami laisvės laipsniai, siekiant nustatyti, ar tam tikrą nulinę hipotezę galima atmesti remiantis visu kintamųjų ir mėginių skaičiumi eksperimente.

Pvz., Svarstant studentų pasirinkimą ir kurso pasirinkimą, 30 ar 40 studentų imties dydis nėra pakankamai didelis, kad būtų galima sukaupti reikšmingų duomenų. Gauti tokie patys ar panašūs tyrimo rezultatai, naudojant 400 ar 500 studentų imtį, yra teisingiau.

Kitame pavyzdyje apsvarstykite galimybę mesti monetą 100 kartų. Tikėtinas 100 monetų išmetimo rezultatas yra tai, kad galvos pakils 50 kartų, o uodegos - 50 kartų. Tikrasis rezultatas gali būti toks, kad galvos kyla 45 kartus, o uodegos - 55 kartus. Chi kvadrato statistika parodo bet kokius neatitikimus tarp laukiamų ir faktinių rezultatų.

Pagrindiniai išvežamieji daiktai

  • Chi kvadratas (χ 2 ) statistika yra testas, kuriuo matuojamas lūkesčių palyginimas su faktiškai stebimais duomenimis.
  • Yra du pagrindiniai chi kvadrato testai: duomenų nepriklausomumo testas ir modelio tinkamumo testai.
  • Šie testai gali būti naudojami norint nustatyti, ar atliekant hipotezės patikrinimą galima atmesti tam tikrą niekinę hipotezę.

Chi kvadrato testo pavyzdys

Įsivaizduokite, atsitiktinė apklausa buvo atliekama 2000 skirtingų rinkėjų - tiek vyrų, tiek moterų. Žmonės, kurie atsakė, buvo suskirstyti pagal lytį ir tai, ar jie yra respublikonai, demokratai, ar nepriklausomi. Įsivaizduokite tinklelį su stulpeliais, pažymėtais respublikiniais, demokratais ir nepriklausomais, ir dviem eilutėmis, pažymėtomis vyrišku ir moterišku. Tarkime, kad 2000 respondentų duomenys yra šie:

RespublikonasDemokratasNepriklausomasIš viso
Patinas400300100800
Moteris5006001001200
Iš viso9009002002000 m

Pirmasis žingsnis apskaičiuojant chi kvadrato statistiką - surasti numatomus dažnius. Jie apskaičiuojami kiekvienam tinklelio „langeliui“. Kadangi yra dvi lyties ir trys politinio požiūrio kategorijos, numatomi šeši dažniai. Tikėtino dažnio formulė:

E (r, c) = n (r) × c (r) n kur: r = kyste eilutė = klausimo stulpelis = atitinkama bendra \ pradžia {suderinta} ir E (r, c) = \ frakas {n (r) \ kartų c (r)} {n} \\ & \ textbf {kur:} \\ & r = \ tekstas {atitinkama eilutė} \\ & c = \ tekstas {nagrinėjama skiltis} \\ & n = \ tekstas {atitinkama bendra suma } \\ \ pabaiga {išlyginta} E (r, c) = nn (r) × c (r) kur: r = kyste eilutė = klausimo stulpelis = atitinkama bendra

Šiame pavyzdyje numatomi dažniai:

  • E (1, 1) = (900 x 800) / 2 000 = 360
  • E (1, 2) = (900 x 800) / 2 000 = 360
  • E (1, 3) = (200 x 800) / 2 000 = 80
  • E (2, 1) = (900 x 1 200) / 2 000 = 540
  • E (2, 2) = (900 x 1 200) / 2 000 = 540
  • E (2, 3) = (200 x 1 200) / 2 000 = 120

Toliau tai yra naudojamos vertės apskaičiuojant chi kvadrato statistiką pagal šią formulę:

Chi-kvadratas = ∑ [O (r, c) −E (r, c)] 2E (r, c) kur: O (r, c) = stebimi duotos eilutės ir stulpelio duomenys \ prasideda {suderinta} & \ tekstas {Kvadratas} = \ suma \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kur:} \\ & O (r, c) = \ tekstas {stebimi nurodytos eilutės ir stulpelio duomenys} \\ \ pabaiga {suderinta} Chi-kvadratu = ∑E (r, c) [O (r, c) −E (r, c)] 2, kur: O (r, c) = stebimi duomenys apie nurodytą eilutę ir stulpelį

Šiame pavyzdyje kiekvienos stebimos vertės išraiška yra:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600 - 540) 2/540 = 6, 67
  • O (2, 3) = (100 - 120) 2/120 = 3, 33

Chi kvadrato statistika lygi šių verčių sumai arba 32, 41. Tada galime pažvelgti į chi kvadrato formos statistikos lentelę, kad pamatytume, atsižvelgiant į mūsų laisvės laipsnius, jei rezultatas yra statistiškai reikšmingas, ar ne.

Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.

Susijusios sąlygos

Laisvės laipsnių apibrėžimas Laisvės laipsniai nurodo maksimalų logiškai nepriklausomų verčių, kurios yra vertės, turinčios laisvę kisti, skaičių duomenų pavyzdyje. daugiau T-testo apibrėžimas T-testas yra tam tikros rūšies statistinė statistika, naudojama nustatyti, ar yra reikšmingas skirtumas tarp dviejų grupių vidurkių, kurie gali būti susiję tam tikromis savybėmis. daugiau tai, ką mums sako atvirkštinė koreliacija Atvirkštinė koreliacija, dar vadinama neigiama koreliacija, yra priešingas dviejų kintamųjų ryšys, kad jie juda priešingomis kryptimis. daugiau kaip veikia likutinis standartinis nuokrypis Liekamasis standartinis nuokrypis yra statistinis terminas, naudojamas apibūdinti stebimų verčių standartinių nuokrypių nuo numatytų verčių skirtumus, kaip parodyta taškais regresijos analizėje. daugiau kaip veikia dispersijos analizė (ANOVA) dispersijos analizė (ANOVA) yra statistinės analizės įrankis, kuris atskiria bendrą duomenų rinkinyje esantį kintamumą į du komponentus: atsitiktinius ir sisteminius veiksnius. daugiau koreliacija Koreliacija yra statistinis matas, kaip du vertybiniai popieriai juda vienas kito atžvilgiu. daugiau partnerių nuorodų
Rekomenduojama
Palikite Komentarą