Prečo hodnota R-Squared nič nehovorí o príčinných súvislostiach?

Prečo hodnota R-Squared nič nehovorí o príčinných súvislostiach?
Anonim

odpoveď:

R-kvadrát označuje, ako dobre pozorované údaje vyhovujú očakávaným údajom, ale poskytuje len informácie o korelácii.

vysvetlenie:

Hodnota R-kvadrát označuje, ako dobre vaše pozorované údaje alebo údaje, ktoré ste zhromaždili, vyhovujú očakávanému trendu. Táto hodnota vám povie silu vzťahu, ale rovnako ako všetky štatistické testy, nie je nič, čo vám povie príčinu vzťahu alebo jeho silu.

V nižšie uvedenom príklade môžeme vidieť, že graf vľavo nemá žiadny vzťah, ako je naznačené nízkou hodnotou R-štvorca. Graf na pravej strane má veľmi silný vzťah, ktorý je indikovaný hodnotou R-štvorca 1. V žiadnom z týchto grafov nemôžeme povedať, čo v konečnom dôsledku spôsobuje tento vzťah.

Korelácia neznamená príčinnú súvislosť. Vaše hodnoty X môžu veľmi dobre ovplyvniť vaše hodnoty Y, ale v hre môžu byť iné faktory alebo vzťah môže byť spôsobený náhodou. Môžeš odvodzovať kauzality, ale toto je vaša interpretácia a nie je možné ju preukázať štatistickým testovaním. Mať vysokú hodnotu R-štvorca vám len hovorí silu vzťahu, ale nie jeho príčinu.

Na preukázanie príčin je veľmi veľká úloha. Ak chcete pochopiť príčinnú súvislosť, vaša najlepšia stávka je prostredníctvom experimentov.