Koreguotas R kvadratas (koreguotas nustatymo koeficientas)

Turinys:

Koreguotas R kvadratas (koreguotas nustatymo koeficientas)
Koreguotas R kvadratas (koreguotas nustatymo koeficientas)
Anonim

Koreguotas R kvadratas (arba pakoreguotas nustatymo koeficientas) naudojamas daugybine regresija, siekiant pamatyti nepriklausomų kintamųjų intensyvumo ar efektyvumo laipsnį paaiškinant priklausomą kintamąjį.

Paprasčiau tariant, pakoreguotas R kvadratas mums nurodo, kiek priklausomo kintamojo variacijos procentų paaiškina visi nepriklausomi kintamieji.

Šio koeficiento naudojimas yra pateisinamas tuo, kad pridedant kintamuosius prie regresijos, nekoreguotas apsisprendimo koeficientas turi tendenciją didėti. Net tada, kai kiekvieno naujo pridėto kintamojo ribinis indėlis neturi statistinės reikšmės.

Todėl pridedant kintamuosius prie modelio, nustatymo koeficientas galėtų padidėti ir galėtume klaidingai manyti, kad pasirinktas kintamųjų rinkinys sugeba paaiškinti didesnę nepriklausomo kintamojo variacijos dalį. Ši problema paprastai vadinama „modelio pervertinimu“.

Variacijos koeficientasRegresijos analizė

Patikslinta nustatymo koeficiento formulė

Norėdami išspręsti aukščiau aprašytą problemą, daugelis tyrėjų siūlo koreguoti nustatymo koeficientą naudojant šią formulę:

R2 į → Koreguotas R kvadratas arba koreguotas nustatymo koeficientas

R2 → R kvadratas arba nustatymo koeficientas

n → Imties stebėjimų skaičius

k → Nepriklausomų kintamųjų skaičius

Atsižvelgiant į tai, kad 1-R2 yra pastovus skaičius, o kadangi n yra didesnis už k, pridedant modeliui kintamuosius, skliausteliuose esantis daliklis tampa didesnis. Vadinasi. taip pat rezultatas padauginus iš 1-R2 . Pagal tai matome, kad formulė sukurta koreguoti ir nubausti koeficientų įtraukimą į modelį.

Be ankstesnio pranašumo, ankstesnėje formulėje naudojamas koregavimas taip pat leidžia palyginti modelius su skirtingu nepriklausomų kintamųjų skaičiumi. Vėlgi, formulė koreguoja kintamųjų skaičių tarp vieno modelio ir kito ir leidžia mums atlikti homogenišką palyginimą.

Grįžtant prie ankstesnės formulės, galime daryti išvadą, kad pakoreguotas nustatymo koeficientas visada bus lygus arba mažesnis už R koeficientą2. Skirtingai nuo nustatymo koeficiento, kuris svyruoja nuo 0 iki 1, pakoreguotas nustatymo koeficientas gali būti neigiamas dėl dviejų priežasčių:

  • Kuo arčiau k artėja prie n.
  • Kuo mažesnis nustatymo koeficientas.
Linijinis koreliacijos koeficientas