A gépi tanulás, hipszter nevén data science, egyre több érdeklődőt vonz, sokak szerencsétlenségére a terület azonban nagyon szerteágazó; a gépi tanulás ma az, ami mindenre ráhúzható az egyszerű statisztikai adatelemzéstől kezdve a képfeldolgozáson át a nyelvfeldolgozásig minden bele tud férni. Bonyolítja a helyzetet, hogy ezeken a területeken különböző megközelítések versenyeznek, vannak bayesiánusok, konnekcionisták stb. Aki szeretné átlátni ezt a területet, az könnyen zavarba kerülhet; nekik nyújt segítséget két remek könyv, amelyek, habár kezdőknek íródtak, mindenkinek jó szolgálatot tehetnek.
Pedro Domingos: The Master Algorithm
Domingos a gépi tanulás egyik központi figurája, aki a tanuló algoritmusok szent grálját keresi, azaz azt az algoritmust, ami egyesíti az összes jelenlegi megközelítés erényeit - erről (is) szól ez az ismeretterjesztő könyv. Domingos saját bevallása szerint is távol áll még a mester algoritmus megtalálásától, de mániájának hála alaposan meg kellett ismerkednie a gépi tanulás különféle irányzataival (szimbolizmus, konnekcionizmus, evolúciós algoritmusok, bayesianizmus, analogizmus), melyeknek egy-egy fejezetet szentelt. Sajnos nem-felügyelt módszereket és a meta-tanulást egy fejezetbe sűríti, amit a saját kutatásáról (számomra) érthetetlenül megírt fejezet követ. A kötet zárása a gépi tanulás társadalmi hatásairól szól, amin érződik, hogy Domingos érdeklődik a téma iránt és olvassa a társadalomtudományokban zajló vitákat erről, de ennél több nincs benne.
Minden hibája ellenére csak ajánlani tudom a könyvet profiknak és kezdőknek egyaránt, hiszen a gépi tanulás ott van a mindennapjainkban, nem árt ismerni.
Brett Lantz: Machine Learning with R
Akik tudnak már valamennyire programozni és rendelkeznek némi statisztikai alapismeretekkel, azok számára ez a könyv a legjobb. Lantz nagyon élvezetesen magyarázza el a legalapvetőbb gépi tanulási algoritmusokat és illusztrálja működésüket egy-egy adathalmazon. A kötet végén az adatelemzői munkához kapunk gyakorlati tippeket, kezdve a kiértékeléstől, az egyszerű hatékonyságot növelő módszerektől az ensemble módszerekig.
A könyvet elolvasva és példákat követve még nem válik senki profi data scientist-é, de aki rendesen dolgozik, az megpróbálkozhat a terület alapkönyvének számító Introduction to Statistical Learning tanulmányozásával.