Išskirtinis yra nenormalus ir ekstremalus stebėjimas statistinėje imtyje ar duomenų eilutėje, kuris gali turėti įtakos jo parametrų įvertinimui.
Paprasčiau tariant, neįvykdymas būtų stebėjimas imtyje arba duomenų eilutė, kuri neatitinka likusių. Įsivaizduokite, pavyzdžiui, kad matuojame klasės mokinių ūgį.
Įsivaizduokime 10 studentų pavyzdį. Kiekvieno iš jų aukštis yra toks:
1 pavyzdys | |
Studentas | Aukštis metrais |
1 | 1,65 |
2 | 1,80 |
3 | 1,72 |
4 | 1,68 |
5 | 1,75 |
6 | 1,85 |
7 | 1,62 |
8 | 1,79 |
9 | 1,82 |
10 | 1,69 |
Vidutinis klasės aukštis būtų 1,73. Jei atsižvelgsime į didžiausią aukštį (1,85) ir mažiausią aukštį (1,62) bei atstumą tarp jų iki vidurkio, pamatysime, kad jis yra atitinkamai 0,113 ir 0,117. Kaip matome, vidurkis yra maždaug intervalo viduryje ir gali būti laikomas gana geru įvertinimu.
Išskirtinis efektas
Dabar pagalvokime apie kitą 10 studentų imtį, kurių aukštis yra toks:
1 pavyzdys | |
Studentas | Aukštis metrais |
1 | 1,65 |
2 | 1,80 |
3 | 1,72 |
4 | 1,68 |
5 | 2,18 |
6 | 2,20 |
7 | 1,62 |
8 | 1,79 |
9 | 1,75 |
10 | 1,69 |
Tokiu atveju vidutinis klasės aukštis būtų 1,81. Jei dabar pažvelgsime į maksimalų aukštį (2,20) ir mažiausią aukštį (1,62) bei atstumą tarp jų iki vidurkio, pamatysime, kad jis yra atitinkamai 0,39 ir 0,18. Šiuo atveju vidurkis nebėra apytiksliai intervalo viduryje.
Dėl 2 ekstremaliausių stebėjimų (2,18 ir 2,20) aritmetinis vidurkis pasislinko link didžiausios pasiskirstymo vertės.
Šiame pavyzdyje matome, kokį poveikį turi pašaliniai rodikliai ir kaip jie gali iškreipti vidurkio apskaičiavimą.
Kaip nustatyti pašalinius dalykus?Kaip ištaisyti pašalinių efektų poveikį
Tokiose situacijose, kai yra nenormalių reikšmių, kurios iš esmės skiriasi nuo likusių, mediana yra geresnė sąmata, kad žinotumėte, kada sukoncentruotas didesnis stebėjimų skaičius.
Abiejų pasiskirstymų atveju ir kadangi mes turime lyginį skaičių reikšmių, mes negalime tiksliai atsižvelgti į vertę, kuri pasiskirsto per pusę, kad apskaičiuotume medianą. Su kuria, išdėstę vertes nuo mažiausios iki didžiausios, atliktume penktą ir šeštą stebėjimą (abu palikome po 4 stebėjimus kiekvienoje pusėje) ir apskaičiuosime medianą taip:
1 pavyzdys:
1,75+1,72/2 = 1,73
2 pavyzdys:
1,79+1,71/2 = 1,75
Kaip matome, 1 pavyzdyje, atsižvelgiant į tai, kad nėra pašalinių ar nenormalių stebėjimų, mediana yra 1,73 ir sutampa su vidurkiu. Priešingai, 2 pavyzdžio vidurkis yra 1,75. Kaip matome, ši vertė yra toliau nuo vidutinio aukščio, kuris buvo 1,81, ir suteikia mums aukštesnį kokybės taškų įvertinimą, kad žinotume, kurioje vietoje yra sutelktas didesnis stebėjimų skaičius.
Taškinis įvertis