Pagrindinis » algoritminė prekyba » Nustatymo koeficientas

Nustatymo koeficientas

algoritminė prekyba : Nustatymo koeficientas
Koks yra nustatymo koeficientas?

Nustatymo koeficientas yra statistinėje analizėje naudojama priemonė, kuria įvertinama, kaip gerai modelis paaiškina ir prognozuoja būsimus rezultatus. Tai rodo paaiškinto duomenų rinkinio kintamumo lygį. Nustatymo koeficientas, taip pat žinomas kaip „R-kvadratas“, naudojamas kaip orientyras modelio tikslumui matuoti.

Vienas iš šio skaičiaus aiškinimo būdų yra pasakyti, kad kintamieji, įtraukti į tam tikrą modelį, paaiškina apytiksliai x% stebimo kitimo. Taigi, jei R2 = 0, 50, apytiksliai pusę stebimo kitimo galima paaiškinti modeliu.

1:58

R-kvadratas

Pagrindiniai išvežamieji daiktai

  • Nustatymo koeficientas yra sudėtinga idėja, kurios pagrindinė dalis yra būsimo duomenų modelio statistinė analizė.
  • Nustatymo koeficientas naudojamas paaiškinti, kiek vieno veiksnio kintamumą gali sukelti jo santykis su kitu veiksniu.

Supratimo koeficiento supratimas

Nustatymo koeficientas naudojamas paaiškinti, kiek vieno veiksnio kintamumą gali sukelti jo santykis su kitu veiksniu. Analizuojant tendenciją, juo labai remiamasi ir jis parodomas kaip reikšmė nuo 0 iki 1.

Kuo arčiau reikšmės yra 1, tuo geresnis šių dviejų veiksnių santykis ar santykis. Nustatymo koeficientas yra koreliacijos koeficiento, dar žinomo kaip „R“, kvadratas, leidžiantis parodyti tiesinį koreliacijos laipsnį tarp dviejų kintamųjų.

Šis ryšys yra žinomas kaip „tinkamo sudėjimo“. 1.0 vertė rodo, kad ji tinka, todėl labai patikimas ateities prognozių modelis, rodantis, kad modelis paaiškina visus pastebėtus variantus. Kita vertus, 0 vertė reikštų, kad modelis iš viso nesugeba tiksliai modeliuoti duomenų. Modeliui su keliais kintamaisiais, tokiems kaip daugialypis regresijos modelis, pakoreguotas R2 yra geresnis nustatymo koeficientas. Ekonomikoje vertinama didesnė nei 0, 60 R 2 vertė.

Nustatymo koeficiento analizės pranašumai

Nustatymo koeficientas yra duomenų rinkinio numatytų balų ir faktinio balų rinkinio koreliacijos kvadratas. Jis taip pat gali būti išreikštas X ir Y balų koreliacijos kvadratu, kai X yra nepriklausomas kintamasis, o Y yra priklausomas kintamasis.

Nepriklausomai nuo vaizdavimo, R kvadratas lygus 0 reiškia, kad priklausomo kintamojo negalima nuspėti naudojant nepriklausomą kintamąjį. Ir atvirkščiai, jei jis lygus 1, tai reiškia, kad nepriklausomo kintamojo visada prognozuojamas priklausomumas nuo kintamojo.

Nustatymo koeficientas, kuris patenka į šį diapazoną, išmatuoja tai, kiek priklausomą kintamąjį prognozuoja nepriklausomas kintamasis. Pvz., R kvadratas 0, 20 reiškia, kad nepriklausomas kintamasis prognozuoja 20% priklausomo kintamojo.

Tinkamumas arba tiesinės koreliacijos laipsnis matuoja atstumą tarp grafike užfiksuotos linijos ir visų duomenų taškų, išsklaidytų aplink grafiką. Įtemptas duomenų rinkinys turės regresijos liniją, kuri yra labai arti taškų ir yra labai tinkama, tai reiškia, kad atstumas tarp linijos ir duomenų yra labai mažas. Gerai tinka R kvadratas, artimas 1.

Tačiau R kvadratas negali nustatyti, ar duomenų taškai, ar numatymai yra šališki. Tai taip pat nenurodo analitikui ar vartotojui, ar nustatymo koeficientas yra geras, ar ne. Pvz., Mažas R kvadratas nėra blogas, ir asmuo turi priimti sprendimą remdamasis R kvadrato skaičiumi.

Apsisprendimo koeficientas neturėtų būti aiškinamas naiviai. Pavyzdžiui, jei modelio R kvadratas nurodomas 75%, jo paklaidų dispersija yra 75% mažesnė už priklausomo kintamojo dispersiją, o jo paklaidų standartinis nuokrypis yra 50% mažesnis už standartinį priklausomo kintamojo nuokrypį. kintamasis. Standartinis modelio paklaidų nuokrypis yra maždaug trečdalis klaidų standartinio nuokrypio, kurį galėtumėte gauti su tik pastoviu modeliu.

Galiausiai, net jei R kvadrato vertė yra didelė, aiškinamųjų kintamųjų modelyje gali nebūti statistinės reikšmės arba praktinis šių kintamųjų efektyvus dydis gali būti labai mažas.

Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.

Susijusios sąlygos

Kas yra klaidos terminas? Klaidos terminas yra apibrėžiamas kaip statistinio modelio kintamasis, kuris sukuriamas, kai modelis nevisiškai parodo tikrąjį ryšį tarp nepriklausomų ir priklausomų kintamųjų. daugiau kaip veikia daugialypė tiesinė regresija Keli linijinė regresija (MLR) yra statistinė technika, kuriai naudojami keli aiškinamieji kintamieji, norint nuspėti atsako kintamojo rezultatą. daugiau „Labiausiai tinkanti linija“ Geriausiai tinkanti linija yra regresijos analizės išvestis, parodanti ryšį tarp dviejų ar daugiau duomenų rinkinio kintamųjų. daugiau R-kvadrato R-kvadrato yra statistinis matas, kuris parodo priklausomo kintamojo dispersijos dalį, kuri paaiškinama nepriklausomu kintamuoju. daugiau Kaip veikia mažiausių kvadratų metodas Mažiausių kvadratų metodas yra statistinis metodas, pagal kurį nustatoma modeliui tinkamiausia linija, apibrėžta lygtimi su tam tikrais stebimų duomenų parametrais. daugiau heteroskedaziškumas Statistikoje heteroskedaziškumas įvyksta, kai kintamojo standartiniai nuokrypiai, stebimi per tam tikrą laiko tarpą, yra nekonstantiniai. daugiau partnerių nuorodų
Rekomenduojama
Palikite Komentarą