Statistinis ženklas - kas tai yra, apibrėžimas ir sąvoka

Turinys:

Statistinis ženklas - kas tai yra, apibrėžimas ir sąvoka
Statistinis ženklas - kas tai yra, apibrėžimas ir sąvoka
Anonim

Statistinė imtis yra duomenų, priklausančių duomenų visumai, pogrupis. Kalbant statistiškai, jis turi būti sudarytas iš tam tikro skaičiaus stebėjimų, kurie tinkamai atspindi visus duomenis.

Statistika, kaip matematikos šaka, yra atsakinga už duomenų rinkimą, jų užsakymą ir analizavimą. Kitaip tariant, kai norime ištirti tam tikrą reiškinį, pereiname prie statistikos. Geras statistikos tyrinėto reiškinio pavyzdys yra vidutinis šalies piliečių atlyginimas

Šia prasme dėl laiko ir išlaidų priežasčių negalime surinkti visų duomenų. Ši duomenų visuma yra vadinamoji duomenų visuma arba tiesiog populiacija.

Kodėl dirbate su statistinėmis imtimis?

Norėdami paaiškinti, kodėl statistinė imtis naudojama vietoj viso gyventojų skaičiaus, pasitelksime aukščiau pateiktą pavyzdį.

Tarkime, kad norime ištirti bet kokį reiškinį. Mūsų atveju šis reiškinys yra vidutinis šalies piliečių atlyginimas. Duomenų populiaciją sudaro kiekvienas šalies darbuotojas. Žinoma, dėl laiko ir išlaidų būtų neįmanoma kiekvieno darbuotojo paklausti, koks yra jų metinis atlyginimas. Tai užtruktų ilgai, arba mums reikėtų daugybės išteklių.

Šiuo metu atsiranda statistinės imties samprata. Užuot klausę milijonų šalies ar regiono darbuotojų, mes renkame tik nedidelį kiekį duomenų. Pavyzdžiui, mes paklausėme 100 000 žmonių. Ši užduotis vis dar yra sudėtinga, tačiau daug lengviau įsiūlyti 100 000 žmonių, nei paprašyti 30 milijonų.

Šis nedidelis duomenų kiekis turi būti tipiškas. Tai yra, jis turi tinkamai atstovauti gyventojams. Jei 100 000 mūsų paprašytų žmonių sutelks turtinguose rajonuose, gausime duomenis, kurie nėra tipiški. Vidutinis atlyginimas būtų daug didesnis nei yra iš tikrųjų.

Tipinės statistinės imties charakteristikos

Jei norite atlikti gerus tyrimus, būtina statistinės imties kokybė. Nenaudinga atlikti sudėtingiausią statistinę metriką naudojant sudėtingiausius modelius, jei statistinė imtis yra neobjektyvi. Tai yra, jei imtis nėra tipiška.

Gaunant reprezentatyvią imtį, yra tam tikrų aspektų, kuriuos tyrėjas turi žinoti iš anksto. Tarp šių aspektų yra tipinės imties ypatybės. Tipinės imties charakteristikos yra šios:

  • Pakankamai didelis dydis: Kai dirbame su imtimis, paprastai dirbame su duomenų kiekiu, kuris yra mažesnis nei populiacija. Tačiau norint, kad statistinė imtis būtų reprezentatyvi, ji turi būti pakankamai didelė, kad būtų laikoma reprezentatyvia. Pavyzdžiui, jei mūsų populiaciją sudaro 10 milijonų duomenų ir mes pasirenkame 10, jai sunku būti reprezentatyviu. Žinoma, didesnė imtis ne visada yra reprezentatyvesnė.
  • Atsitiktinumas: Duomenys iš statistinės imties turi būti atrenkami atsitiktinai. Tai yra, jis turi būti visiškai atsitiktinis. Jei vietoj to, kad tai darytume atsitiktinai, atliktume planuotą duomenų pasirinkimo procesą, įvesime duomenų šalinimo šališkumą. Todėl, norėdami išvengti, kad imtis būtų neobjektyvi ir todėl, kad ji būtų reprezentatyvi, turime atlikti atsitiktinę atranką.

Statistinė išvada

Gavę reprezentatyvų pavyzdį, turime daryti išvadą apie tam tikrą metriką. Dažnai mums įdomu žinoti tam tikrą kintamojo matą. Pirminiame pavyzdyje kintamasis būtų šalies piliečių atlyginimas. Šia prasme metrika, kurią norime išanalizuoti, yra vidutinis šalies piliečių atlyginimas.

Kitaip tariant, turime duomenų populiaciją, kurią sudaro visi Meksikos darbuotojai. Iš šios populiacijos gauname kintamąjį, tai yra metinį atlyginimą. Taikydami tinkamus metodus, gauname tipinį pavyzdį. Ir galiausiai, kai turime duomenų rinkinį, su kuriuo galime dirbti, vidutiniam atlyginimui apskaičiuoti naudojame statistinius išvadų metodus.

Žinoma, kai turėsime duomenų rinkinį, galėtume daryti išvadą apie kitas priemones. Pavyzdžiui, kaip paskirstomas atlyginimas, koks procentas darbuotojų yra mažesnis už tam tikrą atlyginimą arba koks didelis atlyginimų skirtumas.

Statistinės imties pavyzdys

Tarkime, kad norime atlikti tyrimą apie vidutines Kolumbijos šeimų išlaidas sausio mėnesį. Tam turime dvi galimybes:

  1. Įveskite visų Kolumbijos šeimų banko sąskaitas
  2. Paklauskite reprezentatyvaus žmonių skaičiaus

Pirmasis variantas nėra perspektyvus dėl kelių priežasčių. Pirma, kad šeimos neketina atsisakyti savo duomenų ir, antra, kad mes taip pat negalime eiti į šeimą, žiūrėdami duomenis. Daugiausia todėl, kad Kolumbijos gyventojų skaičius artimas 50 milijonų. Tuo tarpu antroji yra galimybė rinkti statistinę imtį.

Tai, ką padarysime, atsižvelgdami į aukščiau paminėtas savybes, paprašysime 100 000 šeimų. Tai yra šiek tiek sudėtinga, bet daug lengviau nei klausti 50 milijonų kolumbiečių. Skirtumas yra didelis. Taigi, remdamiesi ta 100 000 šeimų imtimi, bandysime apskaičiuoti vidutines sausio mėnesio šeimų išlaidas.

Išgauti duomenys bus daugiau ar mažiau patikimi pagal metrikų seriją, į kurią atsižvelgiama atliekant statistinius tyrimus. Žinoma, šie metrikos tipai yra labiau pažengę, todėl jų čia neaptarsime.