Nustatykite pašalinius rodiklius naudodami įprastą pasiskirstymą

Neįprastų nustatymas per normalųjį pasiskirstymą yra procesas, apimantis standartinio nuokrypio slenksčio nustatymą ir kurio metu ketinama rasti kraštutines imties reikšmes.

Kitaip tariant, norint nustatyti išskirtinius rodiklius per normalųjį pasiskirstymą, reikia rasti kraštutines duomenų rinkinio vertes pagal standartizuotą normalią formulę.

  • Vertybės kraštutinumai yra vadinami pašaliniai angliškai.
  • Vertybės vidinis yra vadinami saviškių angliškai.

Vizualiai nustatyti pašalinius parametrus gali būti galimybė, kai turite labai mažai duomenų. Dirbant su duomenų bazėmis yra labai nepraktiška rankiniu būdu rasti pašalinius parametrus. Norėdami išspręsti šią problemą, galime apskaičiuoti, kurios yra vertybės, kurios laikomos kraštutinėmis, palyginus su nuokrypių riba.

Normalaus pasiskirstymo atveju vertė laikoma kraštutine, kai ji yra 3 standartiniai nuokrypiai nuo vidurkio. Kadangi įprastas pasiskirstymas turi 2 uodegas, turime atsižvelgti į tai, kad jį galima nutolinti tiek iš neigiamos, tiek iš teigiamos pusės.

Formulė, skirta aptikti pašalinius rodiklius, naudojant normalųjį pasiskirstymą

Stebėjimų rinkinys gali būti išreikštas ankstesniu būdu, kur x yra vidutinė vertė, virš kurios vertės svyruoja, o sigma - minėtų verčių svyravimo dispersija. Kitaip tariant, sigma yra stebėjimų atstumas nuo vidutinės vertės.

Daugybos koeficientas lemia, ar tai pašalinis, ar vidinis. Jei z ima 3 arba -3 reikšmes, tai, atsižvelgiant į normalųjį pasiskirstymą, stebėjimas y bus išorinis.

Norėdami sužinoti z mes naudojame ankstesnę lygtį:

  • Jei z> = 3 arba z = <-3, tai pagal normalųjį pasiskirstymą galime tai pasakyti Y tai yra kraštutinė vertė arba išskirtinis.
  • Jei z <3 arba z <-3, tai pagal normalųjį pasiskirstymą galime tai pasakyti Y yra vidinė vertybė arba viešai neatskleista informacija.

Normalus standartas

Ar pirmiau pateikta lygtis yra žinoma?

Tiksliai, tai stebėjimo išraiška, kuri seka normalų pasiskirstymą, kai jis yra standartizuotas arba tipizuotas. Jis vadinamas tokiu būdu, nes dalijant iš standartinio arba standartinio nuokrypio skaitiklio skirtumas išreiškiamas nuokrypiais.

Dėl šios priežasties galime susieti nuokrypio vertes z ir tokiu būdu sugebėti jį nusipirkti su 3 nukrypimų riba.

Pavyzdys

Raskite šių stebėjimų kraštutines vertes pagal normalų pasiskirstymą:

Mes vaizduojame pastebėjimus grafike:

Iš pat pradžių jau matome, kad labiausiai nuo kitų esanti vertė greičiausiai gali būti klausi.

Pirmiausia apskaičiuojame vidurkį ir standartinį nuokrypį:

x = vidurkis = 5,8

sigma = standartinis nuokrypis = 10,51

Tada pakeičiame reikšmes į formulę ir apskaičiuojame reikšmę z už kiekvieną stebėjimą:

Aukščiau pateiktos vertės yra dauginamieji sigmos veiksniai, tai yra, z. Viskas, kas yra didesnė nei 3 arba mažesnė nei -3, bus kraštutinė vertė.

Mes galime pamatyti, kad vertė z kuris viršija 3 standartinius nuokrypius, yra tas, kuris atitinka 49 stebėjimą.

Todėl kraštutinė arba išorinė duomenų rinkinio vertė būtų 49.

Populiarios Temos