Pagrindinis » algoritminė prekyba » Verslo analizės regresijos pagrindai

Verslo analizės regresijos pagrindai

algoritminė prekyba : Verslo analizės regresijos pagrindai

Jei kada nors susimąstėte, kaip du ar daugiau duomenų yra susiję vienas su kitu (pvz., Kaip BVP veikia nedarbo ir infliacijos pokyčiai), ar kada nors jūsų viršininkas paprašė jūsų sukurti prognozę ar išanalizuoti prognozes vertinant ryšius tarp kintamųjų, tada vertėtų išmokti regresijos analizę.

Šiame straipsnyje jūs išmoksite paprastos tiesinės regresijos, kartais vadinamos „įprastais mažiausiais kvadratais“ arba OLS regresija, pagrindus, dažniausiai naudojamus prognozavimui ir finansinei analizei. Pradėsime išmokti pagrindinių regresijos principų, pirmiausia sužinosime apie kovariaciją ir koreliaciją, o tada pereisime prie regresijos išvesties kūrimo ir interpretavimo. Populiari verslo programinė įranga, tokia kaip „Microsoft Excel“, gali atlikti visus regresijos skaičiavimus ir išvestis už jus, tačiau vis tiek svarbu išmokti pagrindinę mechaniką.

Kintamieji

Regresijos modelio centre yra ryšys tarp dviejų skirtingų kintamųjų, vadinamų priklausomais ir nepriklausomais kintamaisiais. Pavyzdžiui, tarkime, kad norite prognozuoti savo įmonės pardavimus ir padarėte išvadą, kad jūsų įmonės pardavimai didėja ir mažėja priklausomai nuo BVP pokyčių.

Jūsų prognozuojami pardavimai bus priklausomas kintamasis, nes jų vertė „priklauso“ nuo BVP vertės, o BVP būtų nepriklausomas kintamasis. Tuomet turėsite nustatyti ryšį tarp šių dviejų kintamųjų, kad galėtumėte numatyti pardavimą. Jei BVP padidės / sumažės 1%, kiek padidės ar sumažės jūsų pardavimai?

Kovariancija

Cov (x, y) = ∑ (xn-xu) (yn-yu) N \ pradėti {suderinta} ir Cov (x, y) = \ suma \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ pabaiga {suderinta} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Dviejų kintamųjų santykio apskaičiavimo formulė vadinama kovariancija. Šis skaičiavimas parodo jums santykių kryptį. Jei vienas kintamasis padidės, o kitas taip pat linkęs didėti, kovariacija būtų teigiama. Jei vienas kintamasis padidėtų, o kitas linkęs žemyn, tada kovariacija būtų neigiama.

Faktinį skaičių, kurį gausite apskaičiuodami tai, gali būti sunku suprasti, nes jis nėra standartizuotas. Pavyzdžiui, penkių kovariancija gali būti suprantama kaip teigiamas santykis, tačiau galima pasakyti, kad santykis yra stipresnis nei tada, kai skaičius buvo keturi arba silpnesnis, nei tuo atveju, jei skaičius buvo šeši.

Koreliacijos koeficientas

Koreliacija = ρxy = Covxysxsy \ prasideda {suderinta} ir koreliacija = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ pabaiga {suderinta} Koreliacija = ρxy = sx sy Covxy Visiem, kas noklusina, tas ir tavs.

Turime standartizuoti kovariaciją, kad galėtume geriau ją interpretuoti ir naudoti prognozuojant, o rezultatas yra koreliacijos apskaičiavimas. Koreliacijos apskaičiavimas paprasčiausiai imasi kovariacijos ir padalija ją iš dviejų kintamųjų standartinio nuokrypio sandaugos. Tai įpareigos koreliaciją tarp vertės -1 ir +1.

+1 koreliacija gali būti suprantama kaip prielaida, kad abu kintamieji puikiai juda vienas su kitu, o -1 reiškia, kad jie yra visiškai neigiamai koreliuojami. Ankstesniame mūsų pavyzdyje, jei koreliacija yra +1 ir BVP padidėja 1%, pardavimai padidėtų 1%. Jei koreliacija yra -1, padidėjus 1% BVP, pardavimai sumažės 1% - visiškai priešingai.

Regresijos lygtis

Dabar, kai mes žinome, kaip apskaičiuojamas santykinis santykis tarp dviejų kintamųjų, galime sukurti regresijos lygtį, kad galėtume numatyti ar numatyti kintamąjį, kurio norime. Žemiau pateikiama paprastos tiesinės regresijos formulė. „Y“ yra vertė, kurią mes bandome numatyti, „b“ yra regresijos tiesės nuolydis, „x“ yra mūsų nepriklausomos vertės reikšmė, o „a“ žymi y įsiterpimą. Regresijos lygtis paprasčiausiai apibūdina priklausomo kintamojo (y) ir nepriklausomo kintamojo (x) santykį.

y = bx + a \ prasideda {suderinta} ir y = bx + a \\ \ pabaiga {suderinta} y = bx + a

Pertrauka arba „a“ yra y reikšmė (priklausomas kintamasis), jei x reikšmė (nepriklausomas kintamasis) yra lygi nuliui, todėl kartais ji paprasčiausiai vadinama „konstanta“. Taigi, jei BVP nepasikeistų, jūsų įmonė vis tiek parduotų tam tikrą vertę - ši vertė, kai BVP pokytis lygus nuliui, yra pertrauka. Pažvelkite į žemiau pateiktą diagramą, norėdami pamatyti grafinį regresijos lygties paveikslą. Šioje diagramoje yra tik penki duomenų taškai, pavaizduoti penkiais taškais diagramoje. Tiesine regresija bandoma įvertinti liniją, kuri geriausiai tinka duomenims (geriausiai tinkančiai linijai), o tos linijos lygtis lemia regresijos lygtį.

1 paveikslas: Tinkamiausia linija

Šaltinis: „Investopedia“

Regresijos programoje „Excel“

Dabar, kai suprantate regresinės analizės aplinkybes, padarykime paprastą pavyzdį naudodami „Excel“ regresijos įrankius. Remsimės ankstesniu pavyzdžiu, bandydami numatyti kitų metų pardavimus pagal BVP pokyčius. Kitoje lentelėje išvardyti kai kurie dirbtiniai duomenų taškai, tačiau šie skaičiai realiame gyvenime gali būti lengvai prieinami.

MetaiPardavimaiBVP
2014 metai1001, 00 proc.
2015 metai2501, 90 proc.
2016 metai2752, 40 proc.
2017 metai2002, 60 proc.
2018 metai3002, 90 proc.

Tik pažvelgę ​​į lentelę galite pamatyti, kad tarp pardavimų ir BVP bus teigiama koreliacija. Abu linkę eiti kartu. Naudodamiesi „Excel“, viskas, ką jums reikia padaryti, tai spustelėkite išskleidžiamąjį meniu Įrankiai, pasirinkite Duomenų analizė ir iš ten pasirinkite Regresija . Iškylantįjį langelį lengva užpildyti iš ten; jūsų įvesties Y diapazonas yra stulpelis „Pardavimai“, o jūsų įvesties diapazonas yra stulpelio BVP pokytis; pasirinkite išvesties diapazoną, kuriame norite, kad duomenys būtų rodomi jūsų skaičiuoklėje, ir paspauskite OK. Turėtumėte pamatyti kažką panašaus į pateiktą toliau pateiktoje lentelėje:

Regresijos statistiniai koeficientai

Daugybė R0, 8292243Perėmimas34.58409

R aikštė


0.687613BVP88.15552
Pakoreguotas
R aikštė


0, 583484

-


-


Standartinė klaida51.021807-

-


Stebėjimai5

-


-


Interpretacija

Pagrindinės išvados, kuriomis reikia susirūpinti, norint atlikti paprastą tiesinę regresiją, yra R kvadratas, pertraukimas (pastovus) ir BVP beta (b) koeficientas. R kvadrato skaičius šiame pavyzdyje yra 68, 7% - tai parodo, kaip gerai mūsų modelis prognozuoja ar prognozuoja būsimą pardavimą. Tai rodo, kad modelio aiškinamieji kintamieji numatė 68, 7% priklausomo kintamojo kitimą. Toliau turime 34, 58 pertrauką, kuri mums sako, kad jei prognozuojama, kad BVP pokytis bus lygus nuliui, mūsų pardavimai sudarys apie 35 vienetus. Galiausiai, BVP beta arba koreliacijos koeficientas 88, 15 sako, kad jei BVP padidės 1%, pardavimai greičiausiai padidės apie 88 vienetus.

Esmė

Taigi, kaip jūs naudosite šį paprastą modelį savo versle

Žinoma, tai yra tik paprasta regresija ir yra modelių, kuriuos galite sukurti ir kurie naudoja kelis nepriklausomus kintamuosius, vadinamus keliomis tiesinėmis regresijomis. Bet kelios tiesinės regresijos yra sudėtingesnės ir turi keletą problemų, kurioms aptarti reiktų kito straipsnio.

Palyginkite investicinių sąskaitų teikėjo pavadinimą Aprašymas Skelbėjo informacijos atskleidimas × Šioje lentelėje pateikti pasiūlymai yra iš partnerystės, iš kurios „Investopedia“ gauna kompensaciją.
Rekomenduojama
Palikite Komentarą