Pagrindinis » algoritminė prekyba » Daugybinė tiesinė regresija - MLR apibrėžimas

Daugybinė tiesinė regresija - MLR apibrėžimas

algoritminė prekyba : Daugybinė tiesinė regresija - MLR apibrėžimas
Kas yra daugialypė tiesinė regresija - MLR?

Daugybinė tiesinė regresija (MLR), dar vadinama tiesiog daugialype regresija, yra statistinė technika, kuriai naudojami keli aiškinamieji kintamieji, norint numatyti atsako kintamojo rezultatą. Daugybinės tiesinės regresijos (MLR) tikslas yra modeliuoti tiesinį ryšį tarp aiškinamųjų (nepriklausomų) kintamųjų ir atsako (priklausomų) kintamųjų.

Iš esmės daugialypė regresija yra paprastosios mažiausiųjų kvadratų (OLS) regresijos pratęsimas, apimantis daugiau nei vieną aiškinamąjį kintamąjį.

Kelios tiesinės regresijos formulė yra

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ kur i = n stebėjimams: yi = priklausomi kintamiejixi = plečiamieji kintamieji β0 = y įsikišimas (pastovus terminas) βp = kiekvieno aiškinamojo kintamojo nuolydžio koeficientaiϵ = modelio klaidos terminas (taip pat žinomas kaip liekanos) \ prasideda {suderinta} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {kur, už} i = n \ textbf {stebėjimai:} \\ & y_i = \ tekstas {priklausomas kintamasis} \\ & x_i = \ tekstas {išplėstiniai kintamieji} \\ & \ beta_0 = \ tekstas {y-perėmimas (pastovus) terminas)} \\ & \ beta_p = \ tekstas {kiekvieno aiškinamojo kintamojo koeficiento koeficientas} \\ & \ epsilon = \ tekstas {modelio klaidos terminas (dar žinomas kaip liekanos)} \\ \ pabaiga {suderinta} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ kur i = n stebėjimams: yi = priklausomas kintamasis x = plečiamasis kintamasis β0 = y-kirtis (pastovus terminas) βp = Kiekvieno aiškinamojo kintamojo nuolydžio koeficientaiϵ = modelio klaidos terminas (dar žinomas kaip likutis)

Paaiškinti daugialypę tiesinę regresiją

Paprasta tiesinė regresija yra funkcija, leidžianti analitikui ar statistikui numatyti apie vieną kintamąjį remiantis informacija, kuri yra žinoma apie kitą kintamąjį. Tiesinę regresiją galima naudoti tik tada, kai vienas turi du ištisinius kintamuosius - nepriklausomą kintamąjį ir priklausomą kintamąjį. Nepriklausomas kintamasis yra parametras, naudojamas apskaičiuoti priklausomą kintamąjį ar rezultatą. Daugybinės regresijos modelis apima keletą aiškinamųjų kintamųjų.

Daugybinės regresijos modelis grindžiamas šiomis prielaidomis:

  • Tarp priklausomų kintamųjų ir nepriklausomų kintamųjų yra tiesinis ryšys.
  • Nepriklausomi kintamieji nėra labai stipriai koreliuojami tarpusavyje.
  • y i stebėjimai atrenkami nepriklausomai ir atsitiktinai iš populiacijos.
  • Likučiai paprastai turėtų būti pasiskirstę vidurkiu 0 ir dispersija σ.

Nustatymo koeficientas (R-kvadratas) yra statistinė metrika, naudojama norint išmatuoti, kiek rezultato pokytį galima paaiškinti nepriklausomų kintamųjų variacija. R2 visada didėja, kai prie MLR modelio pridedama daugiau prognozuotojų, net jei numatytojai gali būti nesusiję su rezultato kintamuoju.

Taigi pats savaime R2 negali būti naudojamas nustatant, kurie numatytojai turėtų būti įtraukti į modelį, o kurie turėtų būti neįtraukti. R2 gali būti tik nuo 0 iki 1, kur 0 rodo, kad rezultato negalima numatyti jokiu nepriklausomu kintamuoju, o 1 rodo, kad rezultatą galima numatyti be klaidų iš nepriklausomų kintamųjų.

Aiškinant daugialypės regresijos rezultatus, beta koeficientai galioja išlaikant visus kitus kintamuosius pastovius („visi kiti lygūs“). Daugybinės regresijos išvestis gali būti rodoma horizontaliai kaip lygtis arba vertikaliai lentelės pavidalu.

Pavyzdys naudojant kelias tiesines regresijas

Pavyzdžiui, analitikas gali norėti sužinoti, kaip rinkos judėjimas veikia „Exxon Mobil“ (XOM) kainą. Tokiu atveju jo tiesinė lygtis turės „S&P 500“ indekso kaip nepriklausomo kintamojo arba numatytojo reikšmę, o XOM kaip priklausomo kintamojo kainą.

Realybėje yra keli veiksniai, kurie prognozuoja įvykio baigtį. Pavyzdžiui, „Exxon Mobil“ kainų pokyčiai priklauso ne tik nuo bendros rinkos rezultatų. Kiti prognozuotojai, tokie kaip naftos kaina, palūkanų normos ir naftos ateities kainų pokyčiai, gali turėti įtakos XOM kainai ir kitų naftos kompanijų akcijų kainoms. Norint suprasti ryšį, kuriame yra daugiau nei du kintamieji, naudojama daugialypė tiesinė regresija.

Daugybinė tiesinė regresija (MLR) naudojama matematiniam ryšiui tarp daugybės atsitiktinių kintamųjų nustatyti. Kitaip tariant, MLR tiria, kaip keli nepriklausomi kintamieji yra susiję su vienu priklausomu kintamuoju. Kai kiekvienas nepriklausomas veiksnys bus nustatytas numatyti priklausomą kintamąjį, informacija apie įvairius kintamuosius gali būti naudojama siekiant tiksliai apskaičiuoti, kokį poveikį jie daro rezultato kintamajam. Modelis sukuria tiesios (tiesinės) formos ryšį, kuris geriausiai suderina visus atskirus duomenų taškus.

Remdamiesi aukščiau esančia MLR lygtimi, mūsų pavyzdyje:

  • y i = priklausomas kintamasis: XOM kaina
  • x i1 = palūkanų normos
  • x i2 = naftos kaina
  • x i3 = S&P 500 indekso vertė
  • x i4 = naftos ateities sandorių kaina
  • B 0 = y-pertrauka nuliniu laiku
  • B 1 = regresijos koeficientas, matuojantis priklausomo kintamojo vieneto pokytį, kai keičiasi x i1 - XOM kainos pokytis, kai keičiasi palūkanų normos
  • B 2 = koeficiento vertė, matuojanti priklausomo kintamojo vieneto pokytį, kai keičiasi x i2 - XOM kainos pokytis, kai keičiasi naftos kainos

Mažiausių kvadratų įverčiai, B 0, B 1, B 2 … B p, paprastai apskaičiuojami naudojant statistinę programinę įrangą. Į regresijos modelį galima įtraukti daugybę kintamųjų, kuriuose kiekvienas nepriklausomas kintamasis diferencijuojamas skaičiumi - 1, 2, 3, 4 ... p. Daugybinės regresijos modelis leidžia analitikui numatyti rezultatą, remiantis informacija, pateikiama apie kelis aiškinamuosius kintamuosius.

Vis dėlto modelis ne visada yra visiškai tikslus, nes kiekvienas duomenų taškas gali šiek tiek skirtis nuo modelio numatyto rezultato. Liekamoji vertė E, kuri yra skirtumas tarp faktinio ir numatomo rezultato, įtraukiama į modelį, kad būtų galima atsižvelgti į tokius nedidelius svyravimus.

Darant prielaidą, kad mes vykdome savo XOM kainos regresijos modelį naudodamiesi statistikos skaičiavimo programine įranga, kuri grąžina šią išvestį:

Analitikas aiškintų šią išvestį taip, kad jei kiti kintamieji laikomi pastoviais, XOM kaina padidės 7, 8%, jei naftos kaina rinkose padidės 1%. Modelis taip pat rodo, kad XOM kaina sumažės 1, 5%, padidėjus palūkanų normai 1%. R2 rodo, kad 86, 5% „Exxon Mobil“ akcijų kainos pokyčių galima paaiškinti palūkanų normos, naftos kainos, naftos ateities sandorių ir „S&P 500“ indekso pokyčiais.

Pagrindiniai išvežamieji daiktai

  • Daugybinė tiesinė regresija (MLR), dar vadinama tiesiog daugialype regresija, yra statistinė technika, kuriai naudojami keli aiškinamieji kintamieji, norint numatyti atsako kintamojo rezultatą.
  • Daugybinė regresija yra tiesinės (OLS) regresijos pratęsimas, kuriame naudojamas tik vienas aiškinamasis kintamasis.
  • MLR yra plačiai naudojamas ekonometrijoje ir finansinėse išvadose.

Skirtumas tarp tiesinės ir daugialypės regresijos

Tiesinė (OLS) regresija lygina priklausomo kintamojo atsaką, atsižvelgiant į kai kurių aiškinamųjų kintamųjų pasikeitimą. Tačiau retas atvejis, kai priklausomas kintamasis paaiškinamas tik vienu kintamuoju. Tokiu atveju analitikas naudoja daugialypę regresiją, kuria bandoma paaiškinti priklausomą kintamąjį naudojant daugiau nei vieną nepriklausomą kintamąjį. Kelios regresijos gali būti tiesinės ir netiesinės.

Daugybinė regresija grindžiama prielaida, kad tiek priklausomi, tiek nepriklausomi kintamieji yra tiesiški. Taip pat daroma prielaida, kad nėra reikšmingos nepriklausomų kintamųjų koreliacijos.

Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.

Susijusios sąlygos

Kokios yra regresijos priemonės Regresija yra statistinis matavimas, kuriuo bandoma nustatyti ryšio tarp vieno priklausomo kintamojo (paprastai žymimo Y) ir kitų kintančių kintamųjų (žinomų kaip nepriklausomi kintamieji) serijos stiprumą. daugiau Kas yra klaidos terminas "> Klaidos terminas yra apibrėžiamas kaip statistinio modelio kintamasis, kuris sukuriamas, kai modelis nevisiškai parodo tikrąjį ryšį tarp nepriklausomų ir priklausomų kintamųjų. daugiau kaip mažiausiai veikia mažiausių kvadratų metodas. kvadratų metodas yra statistinė metodika, leidžianti nustatyti modelio tinkamiausias linijas, nurodytas lygtimi su tam tikrais stebimų duomenų parametrais. daugiau ekonometrijos: ką tai reiškia ir kaip ji naudojama ekonometrija yra statistinių ir matematinių modelių taikymas ekonominiam duomenys, skirti teorijoms, hipotezėms ir ateities tendencijoms išbandyti. daugiau R-kvadratas R-kvadratas yra statistinis matas, kuris parodo priklausomo kintamojo dispersijos proporcijas, kurias paaiškina nepriklausomas kintamasis. daugiau kaip veikia nustatymo koeficientas. Nustatymo koeficientas yra priemonė, naudojama statistinėje analizėje siekiant įvertinti, ar gerai modelis paaiškina ir prognozuoja būsimus rezultatus. rtner Nuorodos
Rekomenduojama
Palikite Komentarą