Dispersijos analizė (ANOVA)
Kas yra dispersijos analizė (ANOVA)?Dispersijos analizė (ANOVA) yra statistikoje naudojama analizės priemonė, kuri padalija stebėtą bendrą duomenų rinkinio kintamumą į dvi dalis: sisteminius ir atsitiktinius faktorius. Sisteminiai veiksniai turi statistinę įtaką duotam duomenų rinkiniui, o atsitiktiniai faktoriai neturi. Analitikai naudoja ANOVA testą, kad nustatytų nepriklausomų kintamųjų įtaką priklausomam kintamajam regresijos tyrime.
XX amžiuje sukurti t- ir z-testo metodai buvo naudojami statistinei analizei iki 1918 m., Kai Ronaldas Fišeris sukūrė dispersijos metodo analizę. ANOVA dar vadinama Fišerio dispersijos analize ir tai yra t- ir z-testų pratęsimas. Šis terminas tapo gerai žinomas 1925 m., Pasirodžius Fišerio knygoje „Statistiniai tyrimo darbuotojų metodai“. Jis buvo naudojamas eksperimentinėje psichologijoje ir vėliau išplėstas į sudėtingesnius dalykus.
ANOVA formulė yra:
F = MSTMSE kur: F = ANOVA koeficientasMST = Vidutinė kvadratų suma dėl apdorojimoMSE = Vidutinė kvadratų suma dėl klaidos \ prasideda {išlyginta} ir \ tekstas {F} = \ skiltis {\ tekstas {MST}} {\ tekstas { MSE}} \\ & \ textbf {kur:} \\ & \ text {F} = \ text {ANOVA koeficientas} \\ & \ text {MST} = \ text {Vidutinė kvadratų suma dėl gydymo} \\ & \ tekstas {MSE} = \ tekstas {Vidutinė kvadratų suma dėl klaidos} \\ \ pabaiga {suderinta} F = MSEMST kur: F = ANOVA koeficientasMST = Vidutinė kvadratų suma dėl apdorojimoMSE = Vidutinė kvadratų suma dėl klaida
Ką parodo dispersijos analizė?
ANOVA testas yra pradinis veiksnių, turinčių įtakos tam tikram duomenų rinkiniui, analizės žingsnis. Baigęs testą, analitikas atlieka papildomą metodinių veiksnių, kurie išmatuojamai prisideda prie duomenų rinkinio nenuoseklumo, patikrinimą. Analitikas naudoja ANOVA testo rezultatus f-teste, kad sugeneruotų papildomų duomenų, suderinamų su siūlomais regresijos modeliais.
ANOVA testas leidžia palyginti daugiau nei dvi grupes tuo pačiu metu, kad būtų galima nustatyti, ar tarp jų yra ryšys. ANOVA formulės rezultatas, F statistika (dar vadinama F santykiu), leidžia analizuoti kelias duomenų grupes, siekiant nustatyti kintamumą tarp mėginių ir mėginių viduje.
Jei tarp tirtų grupių nėra jokio realaus skirtumo, kuris vadinamas nuline hipoteze, ANOVA F santykio statistikos rezultatas bus artimas 1. Jos atrankos svyravimai greičiausiai atitiks Fisher F pasiskirstymą. Tai iš tikrųjų yra paskirstymo funkcijų grupė, turinti du būdingus skaičius, vadinamus skaitiklio laisvės laipsniais ir vardiklio laisvės laipsniais.
Pagrindiniai išvežamieji daiktai
- Dispersijos analizė, arba ANOVA, yra statistinis metodas, kuris atskiria stebimo dispersijos duomenis į skirtingus komponentus, kad būtų galima naudoti papildomus bandymus.
- Vienos krypties ANOVA naudojama trims ar daugiau duomenų grupių, norint gauti informacijos apie priklausomų ir nepriklausomų kintamųjų ryšį.
- Jei tarp grupių nėra tikro varianto, ANOVA F santykis turėtų būti artimas 1.
Kaip naudoti ANOVA pavyzdys
Pavyzdžiui, tyrėjas gali išbandyti kelių kolegijų studentus, norėdamas sužinoti, ar vienos kolegijos studentai nuosekliai lenkia kitų kolegijų studentus. Verslo programoje MTTP tyrėjas gali išbandyti du skirtingus produkto kūrimo procesus, kad patikrintų, ar vienas procesas yra geresnis už kitą ekonominio efektyvumo atžvilgiu.
ANOVA testo tipas priklauso nuo daugelio veiksnių. Jis taikomas, kai duomenys turi būti eksperimentiniai. Variantų analizė naudojama, jei nėra prieigos prie statistinės programinės įrangos, dėl kurios ANOVA būtų apskaičiuojama rankomis. Tai paprasta naudoti ir geriausiai tinka mažiems pavyzdžiams. Taikant daugelį eksperimentinių planų, įvairių faktorių lygio derinių imtys turi būti vienodos.
ANOVA yra naudinga tiriant tris ar daugiau kintamųjų. Tai panašu į kelis dviejų imčių „t“ testus. Tačiau tai lemia mažiau I tipo klaidų ir tinka daugeliui problemų. ANOVA grupuoja skirtumus, palygindama kiekvienos grupės priemones, ir paskirsto dispersiją į įvairius šaltinius. Jis naudojamas tiriamiesiems, bandomosioms grupėms, tarp grupių ir grupių viduje.
Vienpusė ANOVA palyginti su dvipusė ANOVA
Yra du ANOVA tipai: vienpusis (arba vienkryptis) ir dvipusis. Vienpusis arba dvipusis reiškia nepriklausomų kintamųjų skaičių analizuojant dispersijos testą. Vienpusis ANOVA įvertina vienintelio faktoriaus įtaką atskiro atsako kintamajam. Tai nustato, ar visi mėginiai yra vienodi. Vienos krypties ANOVA naudojama norint nustatyti, ar nėra statistiškai reikšmingų skirtumų tarp trijų ar daugiau nepriklausomų (nesusijusių) grupių vidurkių.
Dviejų krypčių ANOVA yra vienos krypties ANOVA pratęsimas. Jei naudojate vieną pusę, turite vieną nepriklausomą kintamąjį, veikiantį priklausomą kintamąjį. Su dvipuse ANOVA yra du nepriklausomi asmenys. Pavyzdžiui, dvipusis ANOVA leidžia įmonei palyginti darbuotojų produktyvumą, remiantis dviem nepriklausomais kintamaisiais, tokiais kaip atlyginimas ir įgūdžių rinkinys. Jis naudojamas stebėti dviejų veiksnių sąveiką ir tuo pačiu metu išbandyti dviejų veiksnių poveikį.
Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.