Hogyan tanul egy gép adatokból? Egyáltalán, hogy néz ki egy gép tanítása és mire képes a tanulás után? Mi a különbség a felügyelt és a felügyelet nélküli gépi tanulás között? Hogyan válasszuk ki az ezer lehetséges módszer közül azt, ami a mi problémánkra nézve releváns? Mennyire bízhatunk meg egy gépi tanulási algoritmusban? Brett Lantz Machine Learning with R könyve az alapoktól kezdve gyakorlati példákon keresztül vezeti be az olvasót a gépi tanulás legelemibb kérdéseibe. Nem ígér többet, mint hogy az olvasó képes lesz elemi problémákat megoldani és további forrásokat keresni ha megszereti a gépi tanulást a könyv olvasása során.
Kezdjük a negatívumokkal. A könyv oldalán érdemes a hibajegyzéket intenzíven nézegetni! Ne másoljunk a kötetből kódrészleteket kedvenc szerkesztőnkbe agyatlanul, mert bizony hibák csúsztak a kódba itt-ott. A kiadó oldalán letölthető kódmelléklet ellenben működik - általában. Habár 2013 végén jelent meg a könyv, pár R csomag azóta változott s nem működik minden példakód rendesen, de a hibajegyzék és egy kis Google keresgélés minden problémát megoldhat.
A pozitívumok sora végtelen ellenben! Minimális programozási előismerettel mindenki belevághat. Nem árt, ha az R nem idegen, de aki Pythonban dolgozott már "könyvtárfogyasztó" módban pl. NLTK-val, annak sem okoz majd nehézséget a követése. A matematikához nincs királyi út, de szerencsére akad olyan, ami viszonylag kevés képlettel dolgozik és az is inkább csak azért szerepel hogy kb. értse az olvasó mi is történik a mélyben. A példák általában egy CRAN könyvtárat használnak, így tkp. minden fejezet egy receptnek tekinthető ami leírja hogy ha ilyen problémád van, akkor ezt a megoldást érdemes használni, ehhez így nézzen ki az adatod - és kész! Az elméleti háttér iránt érdeklődőknek persze egy-egy tanulmányra hivatkozik a szerző, de itt nem ezen van a hangsúly.
A kötet abszolút hiánypótló! Nem lesz szakember az, aki elolvassa és megtanulja használni a benne hivatkozott könyvtárakat. Ellenben nem ismerek más olyan könyvet, ami komolyan vette volna, hogy a szélesebb olvasóközönségnek igénye van egy "szájbarágós" bevezetésre, ami helyre rakja a sokat hivatkozott fogalmakat és ad egy fogalmi keretet a mélyebb vizsgálódáshoz. Csak ajánlani tudjuk a Machine Learning with R-t mindenkinek!!!!