Quantile - kas tai, apibrėžimas ir sąvoka

Turinys:

Anonim

Kvantilis yra tas taškas, kuris atsitiktinio kintamojo skirstymo funkciją padalija į reguliarius intervalus.

Todėl tai yra ne kas kita, kaip statistinė technika atskirti duomenis nuo paskirstymo. Žinoma, reikia įvykdyti, kad grupės būtų lygios. Dėl šios priežasties, kaip matysime vėliau, kvantilų yra įvairių tipų, atsižvelgiant į jų daromų skaidinių skaičių.

Jie yra labai naudingi daugelyje praktinių programų, pavyzdyje mes juos parodysime.

Kvantilo skaičiavimo forma

Kvantiles galima apskaičiuoti parametriniu ir neparametriniu požiūriu. Pažvelkime į tai išsamiau ir į vadinamąją „kvantilinę funkciją“.

  • Parametrinis: Jie naudojami paskirstymuose, kurių formą mes žinome. Tai yra, paskirstymas bus normalus, vienodas, eksponentinis ir pan. Tokiu būdu daroma prielaida, kad jis yra žinomas ir pagrindiniai jo parametrai (aritmetinis vidurkis ir dispersija).
  • Neparametrinis: Jis tinka mažiems mėginiams, kur sunku žinoti tikslią jo formą, todėl nežinome jo paskirstymo funkcijos. Šis metodas pateikia panašias reikšmes kaip ankstesnis, kai imtis padidėja, todėl abiejų naudojimas yra abejingas.
  • Kvantilio funkcija: Mes susiduriame su tikimybine skaičiavimo forma. Tikslas yra apskaičiuoti vertę, kuri turi tam tikrą pasiskirstymo funkcijos tikimybę. Nesigilinsime į matematinius klausimus, kurie apsunkina sampratą.

Dažniausios kvantilės

Mes parodysime, kurios statistikoje dažniausiai naudojamos kvantilės. Dauguma jų dažniausiai naudojami tam, kad būtų galima išsamiai išanalizuoti duomenų pasiskirstymą. Be to, dar viena jo paskirtis yra atskirti duomenis į grupes, galint pasirinkti aukščiausią arba žemiausią. Pavyzdyje tai pamatysime išsamiau.

  • Kvartilis: Suskirstykite vertes į keturias lygias grupes ir yra trys kvartilės. Tai dažniausiai. Pirmojo kvartilio (Q1) duomenys yra mažiausi, o trečio kvartilio (Q3) duomenys yra didžiausi. Kita vertus, antroji kvartilė (Q2) atitinka medianą (Me), kuri yra padėties statistika, padalijanti duomenų pasiskirstymą per pusę. Kvantilės reikšmės būtų 0,25 (Q1), 0,5 (Q2) ir 0,75 (Q3).
  • Kvintilė: Panašus į ankstesnį, jis yra rečiau ir dalija duomenis į penkias lygias dalis. Todėl yra keturios kvintilės. Kvantilės reikšmės šiuo atveju būtų 0,20, 0,40, 0,60, 0,80.
  • Dekilė: Šiuo atveju jie yra suskirstyti į dešimt dalių, todėl yra devyni decilai. Vėlgi, tai irgi nėra per dažnai. Jų vertės būtų nuo 0,1 iki 0,9.
  • Procentilės: Mes susiduriame su variantu, kuriame skirstinys yra padalintas į šimtą lygių dalių. Tai gali dominti labai didelius pavyzdžius. Jų vertės svyruoja nuo 0,01 iki 0,99.

Kvantilinis pavyzdys

Pažvelkime į pavyzdį, kuriame turime eilę duomenų apie tam tikros savivaldybės gyventojų pajamas. Apskaičiavome tris reprezentatyviausias kvartiles ir tris deciles. Įtraukiame naudojamas formules, atsižvelgdami į tai, kad deciliams naudojame procentilių atitikmenį. Atminkite, kad Q2 ir D5 duomenys yra lygiaverčiai medianai.

Galime pastebėti, kad asmenų, kurie susiduria su nepalankiausiomis 25% (Q1), pajamos yra 2900. Dekilės atžvilgiu 10% (D1) mažiausiai gaunančių asmenų pajamos yra 2800. Ta pati interpretacija atliekama ir su viršininkais, tačiau atvirkščiai. Daugiausia uždirbantys 25% (trečiasis ketvirtis) gauna 4100 pajamų, o 10% - 4800 pajamų. Todėl kvantilas atspindi svarbią informaciją, kad sužinotumėte daugiau apie kintamąjį.