Statistinis normalizavimas - kas tai yra, apibrėžimas ir sąvoka

Turinys:

Anonim

Statistinis normalizavimas yra kintamojo pasiskirstymo mastelio transformacija, kad būtų galima palyginti elementų rinkinius ir vidurkį pašalinant įtakos poveikį.

Kitaip tariant, normalizavimas yra proporcijos be matavimo vienetų (be matmenų arba nekintamos skalės), leidžiančios palyginti skirtingų kintamųjų ir skirtingų matavimo vienetų elementus.

Statistikoje ir ekonometrikoje naudojamos standartizuotos tikimybių skirstymo lentelės, kad būtų galima rasti tikimybę, kurią stebėjimas atliks, atsižvelgiant į kintamojo vykdomą skirstymo funkciją.

Svarbu neriboti normalizavimo termino tik elementų rinkiniais, kur normalus pasiskirstymas yra geras jų dažnio artėjimas.

Statistinis kintamasis

Lentelė

Šioje lentelėje išsamiai aprašyti dažniausiai statistikoje naudojami standartai, taikomi finansams ir ekonomikai.

  • Tipizuotas arba standartinis balas normalizuoja klaidas, kai galime apskaičiuoti imties parametrus.
  • Studento t pasiskirstymo normalizavimas normalizuoja liekanas, kai parametrai nėra žinomi, ir mes apskaičiuojame juos gaunant.
  • Variacijos koeficientas naudoja vidurkį kaip skalės matą, skirtingai nuo standartizuoto balo ir Studento t, kuriuose naudojamas standartinis nuokrypis. Pasiskirstymas normalizuojamas pagal Puasono ir eksponentinius skirstinius.
  • Standartizuotas momentas gali būti taikomas bet kuriam tikimybių skirstiniui, turinčiam momentų generavimo funkciją. Kitaip tariant, kad momentų integralai yra suartėję.

Programos

Kiek kartų mes skaitėme, kad normalus tikimybių pasiskirstymas atrodo pakankamai geras apytiksliai stebėjimų dažniui, ir mūsų prašoma rasti tikimybę, kad kintamasis X įgauna konkrečią vertę?

Kitaip tariant, mes nustatome X ~ N (μ, σ2), ir mūsų prašoma rasti P (X ≤ xi)

Mes žinome, kad norint rasti P (X ≤ xi), turime ieškoti tikimybės tikimybių pasiskirstymo lentelėse. Šiuo atveju normaliojo skirstinio pasiskirstymo lentelėse. Ekonometrikoje ir kiekybiniame finansavime plačiausiai naudojamos tikimybių pasiskirstymo lentelės: chi kvadratas, Studento t, Fišerio-Snedecoro F, Puasonas, eksponentinis, netikras ir standartinis normalus.

Skirstymo lentelėse apskaičiuotos tikimybės atitinka savybę:

Tai yra, tipizuojamos tikimybės (skaičiai lentelėje). Tada mes taip pat turėsime įvesti kintamąjį pagal skirstymo funkcijos parametrus, jei norime rasti P (X ≤ x) tikimybęi).

Praktinis pavyzdys

Norime sužinoti tikimybę, kad penktadienio rytą slidinėjančių slidininkų skaičius yra 288.

Slidinėjimo kurortas mums sako, kad slidininkų kintamojo dažnis gali apytiksliai atitikti įprastą vidurkio 280 ir dispersijos 16 pasiskirstymą.

Taigi, mes turime:

X ~ N (μ, σ2)

kur X apibrėžiamas kaip „slidininkų“ kintamasis

Jie klausia mūsų tikimybės, kad slidininkų, ketinančių slidinėti penktadienį, skaičius yra mažesnis arba lygus 288. Tai yra:

P (X ≤ 288)

Procesas

Norėdami sužinoti tikimybę, kad slidininkų skaičius yra lygus 288, pirmiausia turime įvesti kintamąjį.

Tada mes žiūrime į nuolatinio standarto normaliojo paskirstymo lentelę:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Tikimybė, kad penktadienio rytą 288 slidininkai eis slidinėti, atsižvelgiant į vidutinius ir dispersijos parametrus, yra 97,72%.