Duomenų mokslas yra disciplina, tirianti, iš kur atsiranda tam tikra informacinė bazė. Taip pat aptariama, kaip šiuos išteklius galima interpretuoti ir pateikti produktyviam naudojimui.
Tai yra, duomenų mokslas yra susijęs su duomenų bazių, saugomų skaitmeninėse rinkmenose, valdymu, iš kurių galima gauti daug naudingos informacijos kaip statistinius rodiklius. Tai gali padėti, pavyzdžiui, įmonei priimti verslo sprendimus.
Duomenų mokslas taip pat teikia įrankius, leidžiančius ne tik interpretuoti, bet ir atvaizduoti, pavyzdžiui, vaizduose, turimus duomenis. Taigi, be kita ko, turime histogramą, juostinę diagramą, pyragų diagramą.
Kaip galima spręsti, šis mokslas yra tarpdisciplininis, nes daugiausia apima matematikos, statistikos ir informatikos žinias.
Duomenų mokslas ir duomenų tipai
Taip pat reikėtų pažymėti, kad duomenų mokslas gali dirbti su dviejų tipų duomenimis:
- Struktūrinis: Jie yra sutvarkyti, pvz., Lentelės su skirtingais stulpeliais, kurių kiekviena turi skirtingą kategoriją, pvz .: vardas, pavardė, amžius, asmens dokumento numeris ir kt.
- Nestruktūruotas: Tokie, kurie neatitinka tam tikro formato, pavyzdžiui, laisvai parašytas tekstas. Tokiu atveju turite interpretuoti turinį ir išgauti duomenis, kuriuos galima tvarkyti.
Atsižvelgiant į visa tai, kas buvo paaiškinta, specialistai, kurie specializuojasi duomenų mokslo srityje, turi ne tik turėti analitinių įgūdžių, bet ir sugebėti perduoti savo apdorotos informacijos turinį.
Duomenų mokslo svarba
Duomenų mokslas yra svarbus įmonėms ar įstaigoms, kurios turi dirbti su dideliu duomenų kiekiu. Taigi tai gali tapti vertinga informacija.
Mes galime susieti duomenų mokslą su didžiaisiais duomenimis, kurie susideda iš mechanizmų, galinčių apdoroti ir valdyti didžiulius duomenis iš įvairių šaltinių, kūrimo. Tikslas yra paversti juos informacija, kurią žmogus gali interpretuoti ir kuri padeda jam priimti sprendimus.
Šie apdorojami duomenys gali būti gaunami iš operacijų tarp asmenų ir organizacijų (pvz., Banko operacijų), kasdienių žmonių veiksmų (pvz., Paieškų internete), mašinų (pvz., Mobiliojo telefono GPS, kuris fiksuoja, kur buvo vartotojas) ar informacijos. biometriniai (pvz., pirštų atspaudai).
Duomenų mokslo istorija
Galima sakyti, kad amerikiečių statistikas Johnas Wilderis Tukey 1960-aisiais pradėjo duomenų mokslą, pabrėždamas duomenų analizės, o ne statistinių modelių testavimo svarbą.
Tačiau tik 1996 m. Paskaitos pavadinime „Duomenų mokslas, klasifikavimas ir susiję metodai“ pirmą kartą pavartotas duomenų mokslo terminas. Tai įvyko „Tarptautinės klasifikacinių bendrovių federacijos“ (IFCS) narių susitikime, vykusiame Kobėje, Japonijoje.
Kitas svarbus etapas įvyko 2005 m., Kai Nacionalinė mokslo taryba paskelbė „Ilgaamžių skaitmeninių duomenų rinkinius, leidžiančius tyrimus ir švietimą XXI amžiuje“. Tame dokumente duomenų mokslininkai apibrėžiami kaip kompiuterių ekspertai, duomenų bazių ir programinės įrangos programuotojai bei kitų sričių specialistai (pavyzdžiui, bibliotekininkai ir archyvarai), kurie yra nepaprastai svarbūs sėkmingai valdant skaitmeninius duomenis.
Tačiau tai vis dar kuriama studijų sritis.