Pasitikėjimo intervalas - kas tai, apibrėžimas ir sąvoka

Turinys:

Anonim

Pasitikėjimo intervalas yra statistikos išvadose naudojama vertinimo technika, leidžianti apriboti porą ar kelias reikšmių poras, per kurias bus surastas norimas taškų įvertis (su tam tikra tikimybe).

Pasitikėjimo intervalas leis apskaičiuoti dvi reikšmes pagal imties vidurkį (vieną viršutinę ir vieną apatinę). Šios vertės apribos diapazoną, kuriame, esant tam tikrai tikimybei, bus nustatytas populiacijos parametras.

Pasitikėjimo intervalas = vidurkis + - paklaidos riba

Tikrosios populiacijos žinojimas apskritai yra labai sudėtingas dalykas. Tarkime, kad gyvena 4 milijonai žmonių. Ar galėtume žinoti vidutines šio gyventojų namų ūkio vartojimo išlaidas? Iš esmės taip. Paprasčiausiai turėtume ištirti visus namų ūkius ir apskaičiuoti vidurkį. Tačiau šio proceso sekimas būtų labai sunkus ir apsunkintų tyrimą.

Tokiomis situacijomis yra lengviau pasirinkti statistinę imtį. Pavyzdžiui, 500 žmonių. Pagal minėtą imtį apskaičiuokite vidurkį. Nors mes vis tiek nežinotume tikrosios populiacijos vertės, galime manyti, kad ji bus artima imties vertei. Tai reiškia, kad pridedame paklaidos ribą ir turime pasitikėjimo intervalo vertę. Kita vertus, mes atimame tą paklaidos ribą iš vidurkio ir turėsime kitą vertę. Tarp šių dviejų reikšmių bus gyventojų vidurkis.

Apibendrinant galima teigti, kad pasikliautinasis intervalas nenaudoja populiacijos parametro taškinio įvertinimo, jei jis padės mums apytiksliai suprasti, kuris iš jų gali būti tikras. Tai leidžia mums riboti dvi reikšmes, kur bus nustatyta populiacijos vidurkis.

variacijos koeficientasKaupiamasis dažnis

Veiksniai, nuo kurių priklauso pasikliautinasis intervalas

Pasitikėjimo intervalo apskaičiavimas daugiausia priklauso nuo šių veiksnių:

  • Pasirinktas imties dydis: Priklausomai nuo duomenų kiekio, kuris buvo naudojamas apskaičiuojant imties vertę, jis bus daugmaž arti tikrojo populiacijos parametro.
  • Pasitikėjimo lygis: Ji informuos, kokia procentinė dalis mūsų įvertinimo yra teisinga. Įprastas lygis yra 95% ir 99%.
  • Mūsų įverčio paklaidos skirtumas: Tai vadinama alfa ir praneša mums apie tikimybę, kad populiacijos vertė yra už mūsų ribų.
  • Apskaičiuotasis imtyje (vidurkis, dispersija, vidurkių skirtumas …): Nuo to priklausys posūkio statistika intervalui apskaičiuoti.

Vidutinio patikimumo intervalo pavyzdys, darant prielaidą, kad normalumas ir žinomas standartinis nuokrypis

Skaičiuojant būtų naudojama tokia suvestinė statistika:

Gautas intervalas būtų toks:

Mes matome, kaip nelygybės kairėje ir dešinėje intervale mes turime atitinkamai apatinę ir viršutinę ribas. Todėl išraiška mums sako, kad tikimybė, kad populiacijos vidurkis yra tarp šių verčių, yra 1-alfa (pasitikėjimo lygis).

Geriau pažvelkime į tai, kas išdėstyta pirmiau, kaip pavyzdį išspręstą pratimą.

Norite įvertinti vidutinį bėgiko laiką maratonui įveikti. Tam buvo skirtas 10 maratonų ir gautas vidutiniškai 4 valandų standartinis 33 minučių (0,55 valandų) nuokrypis. Norite gauti 95% patikimumo intervalą.

Norėdami gauti intervalą, turėtume tik pakeisti duomenis intervalo formulėje.

Pasitikėjimo intervalas būtų mėlynai nuspalvinta pasiskirstymo dalis. Tai ribojamos 2 reikšmės atitiktų 2 raudonas linijas. Centrinė linija, padalijanti pasiskirstymą į 2, būtų tikroji populiacijos vertė.

Svarbu pažymėti, kad šiuo atveju, atsižvelgiant į tai, kad pasiskirstymo N (0,1) tankio funkcija suteikia mums kaupiamąją tikimybę (iš kairės į kritinę vertę), turime rasti vertę, kuri mums palieka 0,975 kairiųjų% (tai yra 1,96).