Pagrindinis » algoritminė prekyba » Neparametrinė statistika

Neparametrinė statistika

algoritminė prekyba : Neparametrinė statistika
Kas yra neparametrinė statistika?

Neparametrinė statistika yra statistinis metodas, kai duomenys nebūtini, kad atitiktų normalų pasiskirstymą. Neparametrinėje statistikoje naudojami duomenys, kurie dažnai būna eiliniai, ty jie remiasi ne skaičiais, o greičiau rangu ar rūšies tvarka. Pavyzdžiui, apklausa, kurioje pateikiami vartotojų pageidavimai, nuo patinkančių iki nemėgstamų, būtų laikoma eiliniais duomenimis.

Neparametrinė statistika apima neparametrinę aprašomąją statistiką, statistinius modelius, išvadas ir statistinius testus. Neparametrinių modelių struktūra nėra apibrėžta a priori, o nustatoma remiantis duomenimis. Neparametrinis terminas nereiškia, kad tokiems modeliams visiškai trūksta parametrų, o kad parametrų skaičius ir pobūdis yra lankstūs ir nėra iš anksto nustatyti. Histograma yra neparametrinio tikimybės pasiskirstymo įvertinimo pavyzdys.

Neparametrinės statistikos supratimas

Statistikoje į parametrinę statistiką įeina tokie parametrai kaip vidutinis, mediana, standartinis nuokrypis, dispersija ir kt. Ši statistikos forma naudoja stebėtus duomenis paskirstymo parametrams įvertinti. Remiantis parametrine statistika, laikoma, kad duomenys atitinka normalųjį pasiskirstymą su nežinomais parametrais μ (populiacijos vidurkis) ir σ 2 (populiacijos dispersija), kurie tada apskaičiuojami naudojant imties vidurkį ir imties dispersiją.

Neparametrinė statistika nedaro prielaidos apie imties dydį ar tai, ar stebimi duomenys yra kiekybiniai.

Neparametrinė statistika nereiškia, kad duomenys yra paimti iš įprasto paskirstymo. Pagal šią statistinio matavimo formą įvertinama paskirstymo forma. Nors yra daugybė situacijų, kai galima daryti prielaidą, kad normalus paskirstymas yra, tačiau taip pat yra keletas scenarijų, kai nebus įmanoma nustatyti, ar duomenys bus platinami paprastai.

Neparametrinės statistikos pavyzdžiai

Pirmajame pavyzdyje apsvarstykite tyrėją, kuris nori įvertinti rudomis akimis gimusių kūdikių skaičių Šiaurės Amerikoje, gali nuspręsti paimti 150 000 kūdikių ir paimti duomenų rinkinio analizę. Jų išmatuotas matas bus naudojamas apskaičiuojant visos kūdikių su rudomis akimis, gimusių kitais metais, populiaciją.

Antrame pavyzdyje apsvarstykite skirtingą tyrėją, norintį sužinoti, ar miegoti anksti, ar vėlai yra susiję su tuo, kaip dažnai žmogus suserga. Darant prielaidą, kad imtis yra atrinkta atsitiktine tvarka iš populiacijos, galima manyti, kad imties dydžio pasiskirstymas pagal ligos dažnį yra normalus. Tačiau negalima manyti, kad eksperimentas, kuriuo matuojamas žmogaus kūno atsparumas bakterijų kamienui, pasiskirstys normaliai.

Taip yra todėl, kad atsitiktinai parinkti mėginio duomenys gali būti atsparūs deformacijai. Kita vertus, jei tyrėjas atsižvelgia į tokius veiksnius kaip genetinė struktūra ir etninė priklausomybė, jis gali pastebėti, kad imties dydis, parinktas naudojant šias savybes, gali būti neatsparus štamui. Taigi negalima manyti, kad normalus pasiskirstymas.

Šis metodas yra naudingas, kai duomenys nėra aiškūs skaitine interpretacija, ir jį geriausia naudoti su tais duomenimis, kurie yra surūšiuoti. Pvz., Asmenybės vertinimo testas gali būti suskirstytas į metrikas taip, kad jos visiškai nesutinka, nesutinka, yra abejingos, sutinka ir tvirtai sutinka. Tokiu atveju turėtų būti naudojami neparametriniai metodai.

Ypatingos aplinkybės

Neparametrinė statistika tapo vertinama dėl lengvo naudojimo. Mažėjant parametrų poreikiui, duomenys tampa tinkamesni atliekant įvairesnius bandymus. Tokio tipo statistika gali būti naudojama be vidurkio, imties dydžio, standartinio nuokrypio ir neįvertinus jokių kitų susijusių parametrų, kai tokios informacijos nėra.

Kadangi neparametrinė statistika daro mažiau prielaidų apie imties duomenis, jos taikymo sritis yra platesnė nei parametrinės statistikos. Tais atvejais, kai parametrinis testavimas yra tinkamesnis, neparametriniai metodai bus mažiau veiksmingi. Taip yra todėl, kad rezultatai, gauti iš neparametrinės statistikos, turi mažesnį pasitikėjimo laipsnį nei tuo atveju, jei rezultatai būtų gauti naudojant parametrinę statistiką.

Pagrindiniai išvežamieji daiktai

  • Neparametrinę statistiką lengva naudoti, tačiau ji neparodo tikslaus kitų statistinių modelių tikslumo.
  • Šis analizės tipas geriausiai tinka svarstant kažko eiliškumą, kai net ir pasikeitus skaitmeniniams duomenims, rezultatai greičiausiai išliks tokie patys.
Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.

Susijusios sąlygos

T paskirstymo supratimas AT paskirstymas yra tikimybės funkcijos rūšis, tinkama įvertinti populiacijos parametrus mažiems imties dydžiams ar nežinomoms dispersijoms. daugiau Kaip veikia imčių paskirstymas Atrankos pasiskirstymas yra statistikos, gautos iš daugybės imčių, paimtų iš konkrečios populiacijos, tikimybės pasiskirstymas. daugiau Kaip naudojamas „Wilcoxon“ testas „Wilcoxon“ testas, kuris nurodo arba „Rank Sum“ testą, arba „Signed Rank“ testą, yra neparametrinis testas, kuris lygina dvi suporuotas grupes. daugiau Neparametrinis metodas Neparametrinis metodas reiškia statistikos tipą, kuris nereikalauja, kad analizuojami duomenys atitiktų tam tikras prielaidas ar parametrus. daugiau T-testo apibrėžimas T-testas yra tam tikros rūšies statistinė statistika, naudojama nustatyti, ar yra reikšmingas skirtumas tarp dviejų grupių vidurkių, kurie gali būti susiję tam tikromis savybėmis. daugiau pasitikėjimo intervalo Pasitikėjimo intervalas matuoja tikimybę, kad populiacijos parametras nukris tarp dviejų nustatytų verčių. daugiau partnerių nuorodų
Rekomenduojama
Palikite Komentarą