Kvartilių nuokrypis - kas tai yra, apibrėžimas ir sąvoka

Kvartilių nuokrypis yra statistinis sklaidos matas, kuris grąžina centrinę tarpkvartilių diapazono vertę ir naudojamas iškreiptuose duomenų rinkiniuose.

Kitaip tariant, kvartilio nuokrypis yra apskaičiuoti tarpkvartilių diapazono (IQR) medianą ir yra naudojamas duomenų rinkiniuose, kuriuose yra gana daug kraštutinių verčių.

Kvartilio nuokrypio stenografija yra DQ.

Tarpkvartilių diapazonas

Tarpkvartilinis diapazonas yra duomenų rinkinio, paprastai naudojamo langelio schemoje, sklaidos matas. Kitaip tariant, tarpkvartilių diapazonas yra skirtumas tarp priešpaskutinio ir pirmojo skirstinio kvartilio, naudojamo dėžutės grafike.

IQR = Q3 - Q1

Tarpkvartilių diapazono naudojimo pranašumas yra tas, kad galima apskaičiuoti kvartilio nuokrypį (DQ), o tai yra labai tinkamas sklaidos matas, kai turime neobjektyvius duomenų rinkinius.

Kvartilių nuokrypio formulė

Kvartilių nuokrypis apskaičiuojamas kaip tarpkvartilių diapazono padalijimas iš 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Kadangi atsižvelgiame tik į trečiosios ir pirmosios kvartilių sklaidą, mes ignoruojame visus duomenis, esančius už šio diapazono ribų. Todėl visos vertybės yra artimos kraštutinumui. Taigi, jei padalinsime tarpkvartilių diapazoną iš dviejų, gausime vidutinę dispersijos vertę.

Kvartilių nuokrypio pavyzdys

Manome, kad norime apskaičiuoti tarpkvartilių diapazoną ir dviratininkų, per metus praleidžiančių mūsų namus, skaičiaus kvartilio nuokrypį.

  1. Pirmiausia suskaičiuojame dviratininkus ir surenkame informaciją lentelėje.
  1. Antra, mes apskaičiuojame pirmąją ir trečiąją kvartiles, kad gautume tarpkvartilių diapazoną.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Trečia, mes apskaičiuojame kvartilio dispersiją, paprasčiausiai padalydami tarpkvartilių diapazoną iš dviejų.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Šio duomenų rinkinio kvartilio sklaida yra 175. Šis skaičius yra centrinė tarpkvartilių diapazono vertė.

Svarbu pažymėti, kad liepos mėnesio duomenys yra ekstremalūs duomenys, nes jie yra kelis kartus didesni nei visi kiti duomenys. Taigi, galima sakyti, kad šis duomenų rinkinys yra šališkas to mėnesio atžvilgiu. Dėl kvartilio išsisklaidymo „nežinojimo“ ekstremalių duomenų atžvilgiu šios priemonės rezultatas yra labai panašus į tai, kad jei liepos mėnesį važinėtų tik 600 dviratininkų. Jei liepą būtų tik 600 dviratininkų, kvartilio sklaida būtų 162,5, ty labai artima 175, atsižvelgiant į tai, kad tą mėnesį dviratininkų yra 10 kartų mažiau.

Populiarios Temos