Az okostelefonok és táblagépek megjelenésével szembe kell néznünk azzal, hogy a megszokott beviteli szeközök nem "fordíthatók le". Az érintőképernyőn megjelenő virtuális billenttyűzeten hosszan gépelni nem sokan szeretnek. Bonyolult menürendszert sem érdemes készíteni a komplex feladatok elvégzéséhez, marad a beszéd alapú interakció. A Siri népszerűségét is ez adja, a blogunkon már bemutatott DragonGo a Nuance saját fejlesztése Android platformra és nem egyszerű utánérzés, hiszen a cég biztosítja a beszédfelismerő rendszert az Apple eszközökhöz is. A technológia tovább lépett és immár elérhető mint ügyfélszolgálati mobil asszisztens (Nuance Nina) és mint általános beviteli eszköz (Nuance NDEV).
A Nuance tavaly vált igazán ismert céggé, amikor az Apple Siri személyi asszisztens alkalmazást megvásárolta és beépítette az iOS mobil verziójába. A lassan húsz éves cég fő profilja a beszédfelismerés és beszédszintetizálás (azaz speech recognition és text-to-speech), legismertebb terméke a DragonNaturally Speaking ami tkp. egy diktáló alkalmazás, de sok eszközhöz (pl. GPS készülékek, ipari környezetben működő szűmítógépekhez stb) szállít megoldásokat. A dokumentum kezelés terén is aktív a cég, hazánkban leginkább a magyar Recognita OCR (optical character recognition - optikai karakterfelismerő) felvásárlásával vált ismerté pár éve.
A Nina kifejezetten ügyfélszolgálati interakciókra lett kitalálva.
Látható hogy az interakciót nagyban megkönnyíti a beszédfelismerés. Az ügyfélszolgálat területén élhetünk egy kis trükkel, hiszen a kontextus segíti pl. a szavak egyértelműsítését (ha számláinkat nézzük át, akkor a "march" szó minden bizonnyal a hónapot jelöli, nem pedig menetelést értünk alatta).
A fenti videót érdemes teljes képernyőn nézni. Az interakció bemutatása mellett érdemes a 0:55 és 1:17 közötti részre figyelni, ui. itt hívják fel a figyelmet arra hogy mutassuk be az ügyfélnek milyen interakciókban vehet részt! Ez a pici "csalás" eléri hogy valamennyire irányított legyen az ember-gép kommunikáció s így a szavak egyértelműsítése és felismerése is sokkal pontosabb lehet. Furcsa hogy a Nuance szabad szótárasnak hírdeti magát, de arra buzdít minket hogy azért mégis csak tervezzük meg az interakció menetét, ami persze a szótárra nézve is megszorításokat jelent.
Az ügyfélszolgálatokon kívül más alkalmazásokat is felvértezhetünk a beszédfelismerés és beszédszintetizálás képességével. Ehhez az NDEV Dragon Mobile SDK (software development kit - szoftverfejlesztési csomag) nyújt segítséget.
Az SDK ingyenes, de a fejlesztés során ill. a kész applikációban használva a beszédfelismerő rendszer igénybevételével arányos díjat kell fizetnünk. Így ingyenes appokban valószínűleg nem fog megjelnni.
A szolgáltatást integrálhatjuk mind a három nagy mobil operációs rendszerbe, de azon készülékek köre melyeken bizonyosan megfelelően is működik majd még szűk. Sajnos a magyar nyelv még nincs fent sem a beszédfelismeréssel, sem a beszédszintetizálással támogatott nyelvek listáján
A fenti video inkább fejlesztőknek szól, de a laikusok is láthatják rajta hogy viszonylag egyszerűen felvértezhetünk egy mobil alkalmazást beszédfelismerési képességekkel. A Nuance fejlesztő kittjével immár a szövegbányászat és a prediktív analitika mellett a szövegfelismerés is elérhető mint szolgáltatás.