Duomenų gavyba - kas tai yra, apibrėžimas ir sąvoka

Turinys:

Duomenų gavyba - kas tai yra, apibrėžimas ir sąvoka
Duomenų gavyba - kas tai yra, apibrėžimas ir sąvoka
Anonim

Duomenų gavyba yra didelių duomenų bazių paieškos procesas, siekiant rasti naudingos informacijos, kurią galima naudoti priimant sprendimus. Taip pat vartojamas angliškas terminas „data mining“.

Tai gali būti suprantama kaip technologija ir programinė įranga, naudojama elgesio modeliams rasti duomenų bazėje. Pagrindinis to pagrindas yra tas, kad šie modeliai padeda priimti sprendimus. Pavyzdžiui, tai galėtų padėti įmonėms suprasti savo klientų elgesio modelius. Taip, kad tai palengvintų strategijų nustatymą siekiant padidinti pardavimus ar sumažinti išlaidas.

Duomenų gavybos privalumai

Esminis šio duomenų analizės proceso privalumas yra daugybė verslo scenarijų, kuriems jį galima pritaikyti, kaip pavyzdį turime:

  • Spėjimas: Bendrovės pardavimų prognozė.
  • TikimybėGeriausių klientų pasirinkimas tiesioginiam susisiekimui telefonu arba el. Paštu.
  • Sekos analizė: Produktų, kuriuos įsigijo klientai, analizė ir patikrinkite jų tarpusavio ryšį.

Duomenų gavybos etapai

Duomenų gavybos procese galime rasti penkis etapus:

  • Tikslas ir duomenų rinkimas: Pirmiausia reikia sutelkti dėmesį į tai, kokio tipo informaciją norime gauti. Įsivaizduokime pavyzdį, kad prekybos centras nori žinoti, koks paros laikas yra daugiausia klientų lankomas. Tai būtų tikslas ir informacija, kurią šiuo atveju nori gauti prekyba.
  • Duomenų apdorojimas ir valdymas: Kai žinome duomenis, kuriuos norime rinkti, mes juos pritaikome. Tai bene sunkiausias proceso etapas. Na, tam reikia atrinkti tipinę imtį, kurią ketinama atlikti. Pasirinkus imtį, ji turi būti išanalizuota, kokio tipo kintamieji ar regresijos modelis bus imami.
  • Modelio pasirinkimas: Tai glaudžiai susijusi su ankstesniu etapu. Kalbama apie modelio ar algoritmo sukūrimą, kuris mums duoda geriausią įmanomą rezultatą. Norėdami tai padaryti, reikia atlikti išsamią kintamųjų, kurie turi būti įtraukti į modelį, analizę. Tai tampa sudėtinga užduotimi, nes tai priklausys nuo analizuojamos informacijos tipo. Todėl duomenų gavėjai atlieka skirtingus algoritmo testus, tokius kaip: tiesinė regresija, sprendimų medis, laiko eilutės, neuroninis tinklas ir kt.
  • Rezultatų analizė ir peržiūra: Iš esmės reikia išanalizuoti rezultatus, kad sužinotumėte, ar jie duoda logišką paaiškinimą. Paaiškinimas, palengvinantis sprendimų priėmimą remiantis rezultatų pateikta informacija.
  • Modelio atnaujinimas: Paskutinis proceso žingsnis būtų modelio atnaujinimas. Labai svarbu, kad tai būtų daroma laikui bėgant, kad jis nebūtų pasenęs. Modelio kintamieji gali tapti nereikšmingi, todėl reikia periodiškai valdyti modelį.