Dispersijos analizė - kas tai, apibrėžimas ir sąvoka

Dispersijos analizė arba ANOVA (dispersijos analizė) yra daugialypės priklausomybės analizės metodai, naudojami siekiant nustatyti, ar tarp trijų ar daugiau gyventojų grupių vidurkių yra reikšmingų skirtumų.

Todėl atlikdami šią analizę sužinosime, ar yra tam tikrų grupių skirtumų, kai modifikuojame vieną ar daugiau charakteristikų. Norėdami sužinoti, mes naudojame duomenų vidurkio vertę.

Jis dažnai naudojamas tokiose srityse kaip ekonomika ar medicina.

Ankstesnės dispersijos analizės prielaidos

ANOVA atlikimui reikia žinoti keletą būtinų sąlygų. Tai būtina norint, kad rezultatai būtų tinkami.

  • Pirma, populiacija turi laikytis normalaus pasiskirstymo. Todėl kalbama apie parametrinio kontrasto tipą, nes žinomi vidurkio ir standartinio nuokrypio populiacijos parametrai.
  • Be to, naudojami mėginiai turi būti nepriklausomi vienas nuo kito. Tai reiškia, kad modifikavimas viename iš jų neturi įtakos kitų vertei.
  • Kita vertus, tiriamų populiacijų skirtumai turi būti vienodi. Tai vadinama homoscedastiškumu.

Dispersijų modelių analizės klasifikavimas

Analizuojant dispersijų modelius, galima naudoti tris toliau pateiktas klasifikacijas:

  • Fiksuoto efekto modelis: Populiacijos yra normalios ir skiriasi tik atitinkamų jų reikšmių verte.
  • Atsitiktinių efektų modelis: Šiuo atveju duomenys turi hierarchiją ir nuo to priklauso populiacijos skirtumai.
  • Mišrių efektų modelis: Būtume susidūrę su modeliu, kuris yra dviejų ankstesnių derinys.

ANOVA pavyzdys: svarbios sąvokos

Yra tam tikro sudėtingumo matematinės lygtys, atliekančios ANOVA. Tačiau svetainėje Economy-Wiki.com mes pasirenkame paprastą ekonomiką, todėl naudodamiesi technologijomis skaičiuoklėje parodysime, kaip tai būtų galima padaryti.

Įsivaizduokime, kad norime sužinoti, ar yra reikšmingų skirtumų tarp Economy-Wiki.com skaitytojų, atsižvelgiant į jų laipsnio giminingumą ekonomikai.

Įspėjimas: duomenys, kuriuos naudosime, yra fiktyvūs.

Turime pereiti į Duomenys, duomenų analizė ir mes pasirinksime veiksnio dispersijos analizę.

Reitingas būtų trijų grupių matrica. Gali būti įdomiau įtraukti antraštes po to ir pateikti norimą formatą. Mūsų atveju su logotipu ir mėlyna spalva.

Matome, kad yra keletas sąvokų, tokių kaip laisvės laipsniai ir tikimybė ar reikšmingumas. Pirmasis apskaičiuojamas automatiškai ir yra grupių skaičius, atėmus vieną. Antrasis nurodo, ar skirtumai yra reikšmingi, ar ne.

Paprastai pradedate nuo priimto pasitikėjimo lygio. Ekonomikoje tai paprastai yra 95% (0,95), o tai susiję su reikšme 0,05 (1-0,095). Taigi, jei ta tikimybė ar p reikšmė yra mažesnė už priimtiną reikšmę, skirtumai yra reikšmingi.

Šiuo atveju atrodo, kad laipsnis neturi įtakos skaitytojų skaičiui (reikšmingumas> 0,05). Todėl panašu, kad dispersijos analizė rodo, kad Economy-Wiki.com domina visus, ne tik specializuotus skaitytojus. Žinoma, jie yra fiktyvūs duomenys, ar ne?