Klasterinė analizė - kas tai, apibrėžimas ir sąvoka

Klasterinė analizė yra daugiamatės statistikos metodų rinkinys, kuriuo siekiama grupuoti atvejų ar asmenų grupę į grupes ar grupes.

Todėl klasterinė analizė yra tam tikros statistinės grupavimo rūšis. Tikslas yra, kad kiekvieno klasterio duomenys būtų kuo panašesni vienas į kitą ir kuo kitokie kitų grupių atžvilgiu. Tai galima padaryti ir su kintamaisiais.

Duomenų transformacija atliekant klasterinę analizę

Viena iš problemų, su kuria susiduriame grupuodami duomenis, yra ta, kad duomenys kartais būna skirtingi matavimo vienetai. Dėl šios priežasties turi būti atliekamas išankstinis grupių analizės žingsnis, leidžiantis grupuoti.

Labiausiai paplitęs metodas yra standartizavimas. Tai naudojama duomenims transformuoti, kad jų matavimo vienetai būtų panašūs. Būtina atsižvelgti į dvi taisykles, dvejetainiai kintamieji nėra standartizuoti ir, jei jie yra kategoriški, jie tampa dvejetainiais (buvimas / nebuvimas).

Klasterinės analizės metodai

Klasterių analizei atlikti yra daugybė metodų, tačiau „Economy-Wiki.com“, vadovaudamiesi mums būdingu paprastumo principu, matysime tinkamiausius schematiškai.

Hierarchiniai metodai

Pirmoji klasifikacija būtų hierarchiniai arba nehierarchiniai metodai. Buvę asmenys grupuoja asmenis į hierarchines fazes (taigi ir jų vardą). Tokiu būdu grupę vienu metu keičia tik vienas objektas, likę likę toje pačioje vietoje.

Savo ruožtu jie skirstomi į:

Aglomeraciniai metodai

Jis susideda iš asmenų grupavimo kiekvieną kartą mažiau grupėse. Jis prasideda nuo grupių skaičiaus, kuris yra lygus atvejų skaičiui, ir mažėja.

Geriausiai žinomi:

  • Artimiausio kaimyno metodas: Tokiu atveju duomenims grupuoti naudojate algoritmą. Tai, ko ieškote, yra minimalus atstumas tarp artimiausių asmenų. Tai labai jautri duomenims, kurie gali sukelti vadinamąjį „triukšmą“. Tolimiausias kaimyno metodas yra panašus.
  • Vidutinis metodas tarp grupių: Tai reiškia, kad apskaičiuoja atstumo tarp grupės asmenų ir ypač vieno iš jų vidurkį. Labai naudinga sumažinti vadinamąjį „triukšmą“.
  • Vardo metodas: Tai prideda nuokrypių tarp kiekvieno individo ir jo sankaupos vidurkio kvadratus, kad būtų išvengta informacijos praradimo. Tai yra vienas iš geriausiai žinomų ir turi metodo pranašumų, pagrįstų vidutine, bet didesne diskriminacijos galia.

Disociaciniai metodai

Šiuo atveju tai, ką darote, yra susiskaldymas. Jis prasideda vienu klasteriu, o skirstymas siūlomas remiantis keletu reikalavimų.

Dažniausiai yra:

  • Tarp grupės vidurkio, artimiausio kaimyno ir tolimiausio kaimyno metodo: Šie trys metodai yra panašūs į ankstesnį atvejį, tačiau taikomi disociacinis metodas. Tai yra, šį kartą tai, ką darome, yra atskiri, o ne grupuojami.
  • Centroid metodas: Jis plačiai naudojamas objekto vietos optimizavimo problemoms spręsti. Norėdami rasti tinkamiausias, naudokite šio tipo analizę.

Nehierarchiniai metodai

Šiuo atveju jie prasideda iš anksto nustatytu sprendimu. Tai yra klasterių analizės pradinis taškas. Tokiu būdu grupės sudaromos iš anksto ir kiekvienas atvejis bus patalpintas viename iš jų, atsižvelgiant į jo ypatybes. Savo ruožtu galime juos suskirstyti į kitus pogrupius.

  • Perkėlimo metodai: Svarbiausi yra centroidiniai metodai, tokie kaip k-priemonės. Medioidų, tokių kaip PAM. Arba dinamiškų debesų.
  • Tiesioginiai metodai: Svarbiausias yra blokų grupavimas, plačiai naudojamas duomenų gavyboje.
  • Redukciniai metodai: Tai pagrįsta veiksnių analize.
  • Tankio paieškos metodai: Viena vertus, būtų tipologinių metodų, tokių kaip modalinė analizė. Kita vertus, mes turime tikimybinių, tokių kaip Vilkas.

Klasterių analizės pavyzdžiai

Pažiūrėkime, pagaliau, keletą grupių analizės programų pavyzdžių.

  • Įsivaizduokime, kad turime šalių grupę, kurią norime sugrupuoti pagal tam tikrus makroekonominius kintamuosius, tokius kaip infliacija ar nedarbas. Tokio tipo analizę galime panaudoti homogeniškoms grupėms, pavyzdžiui, daugiau ar mažiau išsivysčiusioms šalims.
  • Kitas pavyzdys galėtų būti tam tikrų sociodemografinių savybių turintys vartotojai. Idėja yra sukurti grupes su panašiais asmenimis, kurios, savo ruožtu, labai skiriasi viena nuo kitos.
  • Bet be ekonomikos klasterinė analizė yra naudinga ir kituose moksluose. Pavyzdžiui, biologijoje, klasifikuojant rūšis, arba geologijoje, daryti tą patį su mineralais.

Padėsite svetainės plėtrą, dalintis puslapį su draugais

wave wave wave wave wave