znanost o podacima

ZNANOST O PODACIMA

John D. Kelleher, Brendan Tierney

Znanost o podacima obuhvaća skup načela, definicija problema, algoritama i procesa za izvlačenje nejasnih i korisnih uzoraka iz velikih podataka (Big Data) s ciljem poboljšanja donošenja odluka temeljenjim na uvidima u velike podatke. Kao područje djelovanja, znanost o podacima obuhvaća skup načela, definicija problema, algoritama i procesa za izvlačenje neočiglednih, ali korisnih uzoraka ponašanja podataka iz velikih podataka. Ona je usko povezana s područjima rudarenja podataka i strojnog učenja, ali je opsegom od njih šira.
Danas znanost o podacima upravlja donošenjem odluka u gotovo svim dijelovima modernih društava. Neki od načina na koje znanost o podacima može utjecati na vaš svakodnevni život, između ostalog, uključuju: izbor oglasa koji vam se nude putem virtualnog oglašavanja; to su preporuke za filmove koje biste trebali pogledati, knjige koje biste trebali pročitati i prijateljske veze koje biste trebali uspostaviti; prijedloge o tome koje poruke e-pošte svrstati u mapu neželjene pošte; pogodnosti koje će vam se ponuditi prilikom obnove pretplate na uslugu mobitela; ponudu cijene premije zdravstvenog osiguranja koja vam
se nudi; razmještaj i dinamiku funkcioniranja semafora u vašem području; sastav lijekova koje trebate; kao i to na kojim mjestima u vašem gradu vreba policija.
Cilj ove knjige je pružiti uvod u znanost o podacima koji pokriva njezina suštinska dostignuća, do razine koja osigurava principijelno razumijevanje područja.
Prvo poglavlje uvodi područje znanosti o podacima i daje kratak prikaz njegova razvoja. Također se objašnjava zašto je znanost o podacima važna danas i navode neki od čimbenika koji utječu na njezino usvajanje.
Drugo poglavlje uvodi temeljne pojmove vezane uz same podatke. Ono također opisuje standardne faze provedbe projekata znanosti o podacima: razumijevanje poslovanja, razumijevanje podataka, priprema podataka, modeliranje, vrednovanje i implementacija.
Treće poglavlje opisuje tipičnu infrastrukturu organizacija, uspostavljenu za potrebe znanosti o podacima, kao i neka suvremena rješenja vezana uz problem kolanja velikih skupova podataka unutar podatkovne infrastrukture, koja uključuju korištenje strojnog učenja integriranog s bazom podataka, korištenje sustava Hadoop za pohranu podataka i njihovu obradu, te razvoj hibridnih sustava baza podataka koji glatko kombiniraju tradicionalna programska rješenja za baze podataka i rješenja slična Hadoopu.
Četvrto poglavlje uvodi područje strojnog učenja i objašnjava neke od najpopularnijih algoritama i modela strojnog učenja, uključujući neuronske mreže, modele dubokog učenja i modele stabla odlučivanja.
Peto poglavlje usredotočuje se na povezivanje ekspertize u domeni strojnog učenje s problemima iz stvarnog svijeta, prikazom niza standardnih poslovnih problema i opisivanjem njihova rješavanja uz pomoć strojnog učenja.
Šesto poglavlje razmatra etičke posljedice znanosti o podacima, najnovija dostignuća u pravnoj regulativi u tom području, kao i neke nove računalne pristupe očuvanju privatnosti pojedinaca u procesima vezanim uz velike podatke.
Naposljetku, sedmo poglavlje opisuje neka od područja u kojima će znanost o podacima imati značajan utjecaj u bliskoj budućnosti i postavlja neka od načela koja su važna za to hoće li projekt iz njezina dosega biti uspješan ili ne.


Kratak sadržaj

Predgovor seriji
Predgovor
Zahvale
1 Što je znanost o podacima?
2 Što su podaci, a sto skupovi podataka?
3 Ekosustav znanosti o podacima
4 Uvod u strojno učenje
5 Standardne zadaće znanosti o podacima
6 Privatnost i etika
7 Budući trendovi i načela za postizanje uspjeha
Kazalo pojmova
Bilješke
Naslovi za daljnje čitanje
Literatura
Kazalo

Pošalji