Neteisinga koreliacija
Kas yra klaidinga koreliacijaStatistikoje klaidinga koreliacija arba apgaulingumas reiškia ryšį tarp dviejų kintamųjų, kurie atrodo priežastiniai, bet nėra. Neteisingi santykiai dažnai atrodo kaip vienas kintamasis, paveikiantis kitą. Šią klaidingą koreliaciją dažnai sukelia trečiasis faktorius, kuris tyrimo metu nėra akivaizdus, kartais vadinamas klaidinančiu veiksniu.
Pagrindiniai išvežamieji daiktai
- Neteisinga koreliacija arba apgaulingumas yra tada, kai du veiksniai atrodo atsitiktinai susiję, bet nėra.
- Priežastinis ryšys dažnai atsiranda dėl panašaus judesio diagramoje, kuris pasirodo atsitiktinis arba kurį sukelia trečiasis „klaidinantis“ faktorius.
- Neteisingą koreliaciją dažnai gali sukelti mažas imties dydis arba savavališkos baigtys.
Kaip veikia apgaulinga koreliacija
Kai du atsitiktiniai kintamieji atidžiai seka vienas kitą diagramoje, nesunku įtarti koreliaciją ar ryšį tarp dviejų veiksnių, kai pokytis turi įtakos kitam. Atmetus „priežastinį ryšį“, kitą temą, šis pastebėjimas gali priversti diagramos skaitytoją patikėti, kad kintamojo A judėjimas yra susijęs su judėjimu kintamajame B arba atvirkščiai. tačiau kartais, atidžiau atlikus statistinį tyrimą, išlyginti judesiai yra atsitiktiniai arba atsiranda dėl trečiojo veiksnio, veikiančio pirmuosius du. Tai klaidinga koreliacija. Tyrimai, atlikti su mažais imties dydžiais ar savavališkomis pasekmėmis, yra ypatingai jautrūs apgaulingumui.
Neteisingų koreliacijų pavyzdys
Atrasti įdomias sąsajas nėra per sudėtinga. Vis dėlto daugelis pasirodys apgaulingi. Vyresnių rūšių Wall Street gatvėje populiarios dvi klaidingos sąsajos yra susijusios su moterimis ir sportu. 1920-aisiais kilusi sijonų ilgio teorija teigia, kad sijonų ilgiai ir akcijų rinkos kryptys yra tarpusavyje susiję. Jei sijonų ilgis yra ilgas, tai reiškia, kad akcijų rinka krinta; jei jų trūksta, rinka auga. Maždaug sausio pabaigoje kalbama apie vadinamąjį „Super Bowl“ rodiklį, kuris leidžia manyti, kad AFC komandos pergalė greičiausiai reiškia, kad ateinančiais metais akcijų rinka smuks, o NFC komandos pergalė rodo, kad turgus. Nuo 1966 m. Rodiklio tikslumas buvo 80%. Tai įdomus pokalbis, bet tikriausiai ne tai, ką rimtai patariantys finansai pataria kaip investavimo strategiją klientams.
Čia yra keletas įprastų apgaulingų koreliacijų pavyzdžių:
- Sumažėja, kai didėja ledų pardavimai. Gali atrodyti, kad išaugę ledų pardavimai sukelia daugiau paskendimo atvejų, tačiau iš tikrųjų dėl kylančio karščio daugiau žmonių gali plaukti, taip pat nusipirkti daugiau ledų.
- JAV žmogžudysčių skaičius 2006–2011 m. Sumažėjo taip pat, kaip ir „Microsoft Internet Explorer“ naudojimas.
- Vadovai, kurie sako maloniai ir ačiū, dažniau džiaugiasi geresniais dalyviais.
- Žmonės, nešiojantys „Oakland Raiders“ komandos įrankius, labiau linkę į nusikaltimus.
Kaip pastebėti klaidingas koreliacijas
Statistikai ir kiti duomenis analizuojantys mokslininkai visą laiką turi ieškoti klaidingų ryšių. Jie naudoja daugybę metodų, įskaitant:
- Tinkamo reprezentatyvaus mėginio užtikrinimas.
- Tinkamo mėginio dydžio gavimas.
- Būkite atsargūs dėl savavališkų pasekmių.
- Kontroliuoti kuo daugiau išorinių kintamųjų.
- Naudojant niekinę hipotezę ir patikrinant stiprią p vertę.