Aký je vzťah medzi R-Squared a korelačným koeficientom modelu?

Aký je vzťah medzi R-Squared a korelačným koeficientom modelu?
Anonim

odpoveď:

Pozri na toto. Úver Gauravovi Bansalovi.

vysvetlenie:

Snažil som sa vymyslieť najlepší spôsob, ako to vysvetliť a narazil som na stránku, ktorá robí naozaj peknú prácu. Radšej by som dal tomuto chlapcovi uznanie za vysvetlenie. V prípade, že odkaz nefunguje pre niektoré, uvádzam niektoré informácie nižšie.

Jednoducho povedané: # R ^ 2 # hodnota je jednoducho štvorcom korelačného koeficientu # R #.

korelačný koeficient (# R #) modelu (povedzme s premennými #X# a # Y #) má hodnoty medzi #-1# a #1#, Popisuje ako #X# a # Y # sú korelované.

  • ak #X# a # Y # sú v dokonalom spojení, potom bude táto hodnota pozitívna #1#
  • ak #X# zvyšuje, kým # Y # klesá presne opačným spôsobom, potom bude táto hodnota #-1#
  • #0# by nastala situácia, keď neexistuje vzájomný vzťah #X# a # Y #

Avšak toto # R # hodnota je užitočná len pre jednoduchý lineárny model (len #X# a # Y #). Akonáhle zvážime viac ako jednu nezávislú premennú (teraz máme # # X_1, # # X_2, …), je veľmi ťažké pochopiť, čo znamená korelačný koeficient. Sledovanie, ktorá premenná prispieva k korelácii, nie je tak jasné.

Toto je miesto, kde # R ^ 2 # hodnota. Je to jednoducho štvorček korelačného koeficientu. Preberá hodnoty medzi #0# a #1#, kde hodnoty blízke #1# znamenajú väčšiu koreláciu (či už pozitívne alebo negatívne) a #0# neznamená žiadnu koreláciu. Iný spôsob, ako na to myslieť, je ako zlomková variácia v závislej premennej, ktorá je výsledkom všetkých nezávislých premenných. Ak závislá premenná veľmi závisí od všetkých jej nezávislých premenných, hodnota bude blízka #1#, tak # R ^ 2 # je oveľa užitočnejšie, pretože sa dá použiť aj na opis modelov s viacerými premennými.

Ak by ste chceli diskutovať o niektorých matematických pojmoch, ktoré súvisia s prepojením týchto dvoch hodnôt, pozrite si to.