HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

bluefin labs - az új Nielsen

2012.09.04. 12:00 Szerző: Zoltán Varjú Címkék: tv beszédtechnológia nyelvtechnológia bluefin Deb Roy kognitív tudomány

"A marketingre költött összeg fele kidobott pénz, csak nem tudjuk, hogy melyik fele!" - tartja a mondás. Az online marketing előretörésének részben az az oka, hogy egész jól mérhető mire költötte el a hirdető a pénzét. A televíziós hirdetések hatékonyságát általában a műsoridő nézettségéhez kötik, amit különféle módszerekkel mérnek. A bluefin labs teljesen új megközelítéssel a műsorfolyamok elemzését köti össze a közösségi médiával, így kínál mélyebb és pontosabb hatékonyságmérést és közönségelemzést.

A bluefin labs technológiája a Deb Roy által vezetett Human Speechome Project kutatási programon alapul, melyet az MIT Media Lab Cognitive Machines kutatócsoportja végzett. Ennek keretében Roy házának minden helyiségébe kamerákat és mikrofonokat helyeztek el, melyek tkp. mindent rögzítettek. Roy, mint a kognitív tudományok kutatója elsősorban a nyelvelsajátítás iránt érdeklődött, házának "betechnikázásához" fia születése adta az ötletet, hiszen a csemete érkezése egyben remek alkalom volt arra, hogy élesben végezzen megfigyeléseket. Az évek során keletkezett hatalmas mennyiségű audiovizuális adat kezelésére kidolgozott technikák képezték a bluefin alapjait.

A bulefin valós időben elemzi és tárolja szinte az összes egyesült államokbeli országos televízió adását. Az elemzés eredménye egy tartalmi háló, azaz a műsorok közötti kapcsolatok (csatorna, szereplők, reklámok stb.) térképe. Ezt a hálót igyekszik összekapcsolni valahogy a közösségi médiában megjelenő reakciókkal Roy és csapata.

bluefin.gif

A módszer természetesen nem váltja ki a hagyományos nézettségi méréseket, sokkal inkább kiegészíti azokat. A közösségi médiában megfigyelhetjük milyen reakciók érkeznek egy-egy műsorra, belepillanthatunk a közönség hangulatába, véleményébe. Egy minőségi borokat hirdető marketingesnek nem mindegy pl. hogy egy nyersen fogalmazó, alapvetően fiatal férfi közönség látja-e a hirdetését, vagy éppen kifinomult, nemi arányokban és korösszetételben vegyes operabarát közösség. Mivel mind a műsorfolyam, mind az online kommunikáció valós időben kerül elemzésre, el lehet különíteni a tartalommal kapcsolatos véleményeket a reklámoktól.

Érdekes, hogy egy alapvetően elméleti kutatás mellékterméke egy nagyon gyakorlatias megoldás lett. Ne feledjük, amikor alapkutatásokra költik az adófizetők pénzét, annak nem csak hosszú távon lehet megtérülése. Sok részeredmény hasznosulhat menet közben is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Nuance - beszédtechnológia mint szolgáltatás

2012.08.28. 12:00 Szerző: Zoltán Varjú Címkék: mobil beszédtechnológia SaaS Nuance Nina NDEV DragonMobile

Az okostelefonok és táblagépek megjelenésével szembe kell néznünk azzal, hogy a megszokott beviteli szeközök nem "fordíthatók le". Az érintőképernyőn megjelenő virtuális billenttyűzeten hosszan gépelni nem sokan szeretnek. Bonyolult menürendszert sem érdemes készíteni a komplex feladatok elvégzéséhez, marad a beszéd alapú interakció. A Siri népszerűségét is ez adja, a blogunkon már bemutatott DragonGo a Nuance saját fejlesztése Android platformra és nem egyszerű utánérzés, hiszen a cég biztosítja a beszédfelismerő rendszert az Apple eszközökhöz is. A technológia tovább lépett és immár elérhető mint ügyfélszolgálati mobil asszisztens (Nuance Nina) és mint általános beviteli eszköz (Nuance NDEV).

A Nuance tavaly vált igazán ismert céggé, amikor az Apple Siri személyi asszisztens alkalmazást megvásárolta és beépítette az iOS mobil verziójába. A lassan húsz éves cég fő profilja a beszédfelismerés és beszédszintetizálás (azaz speech recognition és text-to-speech), legismertebb terméke a DragonNaturally Speaking ami tkp. egy diktáló alkalmazás, de sok eszközhöz (pl. GPS készülékek, ipari környezetben működő szűmítógépekhez stb) szállít megoldásokat. A dokumentum kezelés terén is aktív a cég, hazánkban leginkább a magyar Recognita OCR (optical character recognition - optikai karakterfelismerő) felvásárlásával vált ismerté pár éve.

A Nina kifejezetten ügyfélszolgálati interakciókra lett kitalálva.

Látható hogy az interakciót nagyban megkönnyíti a beszédfelismerés. Az ügyfélszolgálat területén élhetünk egy kis trükkel, hiszen a kontextus segíti pl. a szavak egyértelműsítését (ha számláinkat nézzük át, akkor a "march" szó minden bizonnyal a hónapot jelöli, nem pedig menetelést értünk alatta).

A fenti videót érdemes teljes képernyőn nézni. Az interakció bemutatása mellett érdemes a 0:55 és 1:17 közötti részre figyelni, ui. itt hívják fel a figyelmet arra hogy mutassuk be az ügyfélnek milyen interakciókban vehet részt! Ez a pici "csalás" eléri hogy valamennyire irányított legyen az ember-gép kommunikáció s így a szavak egyértelműsítése és felismerése is sokkal pontosabb lehet. Furcsa hogy a Nuance szabad szótárasnak hírdeti magát, de arra buzdít minket hogy azért mégis csak tervezzük meg az interakció menetét, ami persze a szótárra nézve is megszorításokat jelent.

ndev.png

Az ügyfélszolgálatokon kívül más alkalmazásokat is felvértezhetünk a beszédfelismerés és beszédszintetizálás képességével. Ehhez az NDEV Dragon Mobile SDK (software development kit - szoftverfejlesztési csomag) nyújt segítséget.

Az SDK ingyenes, de a fejlesztés során ill. a kész applikációban használva a beszédfelismerő rendszer igénybevételével arányos díjat kell fizetnünk. Így ingyenes appokban valószínűleg nem fog megjelnni.

nina02.png

A szolgáltatást integrálhatjuk mind a három nagy mobil operációs rendszerbe, de azon készülékek köre melyeken bizonyosan megfelelően is működik majd még szűk. Sajnos a magyar nyelv még nincs fent sem a beszédfelismeréssel, sem a beszédszintetizálással támogatott nyelvek listáján

A fenti video inkább fejlesztőknek szól, de a laikusok is láthatják rajta hogy viszonylag egyszerűen felvértezhetünk egy mobil alkalmazást beszédfelismerési képességekkel. A Nuance fejlesztő kittjével immár a szövegbányászat és a prediktív analitika mellett a szövegfelismerés is elérhető mint szolgáltatás.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Prediktív analitika mint szolgáltatás

2012.08.21. 12:00 Szerző: Zoltán Varjú Címkék: precog gépi tanulás big data Google SaaS bigml labcoat Google Prediction

Napjainkban már elég érett a nyelvtechnológia, ahhoz, hogy megjelenhessenek olyan cégek, melyek szolgáltatásként egy API (azaz application programming interface) formájában ajánlhatják a szövegelemzési eljárásokat. Most az evvel párhuzamosan megjelent ún. machine learning as a services (gépi tanulás mint szolgáltatás) irányzatot tekintjük át.

01bigml.png

A bigML egy egyszerűen használható online felületet nyújt. Adatainkat feltöltve nincs más dolgunk, mint a rendszer segítségével kiválasztani az adatok pontos struktúráját és meghatárzozni a mintát, amivel dolgozni szeretnénk. Ezután jöhet az elemzés.

02bigml.png

A szövegklasszifikáció nagyon szépen működik,  kényelmes hogy sok paramétert változtathatunk a modellben és tényleg használható elemzéseket is készíthetünk. Egy API segítségével lehetőségünk van arra, hogy a gyakran ismételt elemzéseket automatizálva generáljuk. Más kérdés, hogy mennyire szeretnénk pl. érzékeny adatokat más szerverén tárolni.

03precog.png

A precog szintén egy böngészőből elérhető elemzőfelületet kínál labcoat néven.

04precog.png

A felület sokkal inkább hasonlít egy IDE-ra (integrated development environment - integrált fejlesztői környezet), mint a bigML kattingatós interfészére. Az elemzéseket a quirrel nyelven írhatjuk meg, ami egyrészt nagyobb flexibilitást biztosít mint egy kötött menürendszer, másrészt viszont erősen leszűkíti a felhasználók körét.

00google.png

A Google Prediction API nem törődik a csilivili vizualizációval, "csupán" azt ajánlja, hogy elvégzi az elemzéseket. Nagyon átgondolták hogy milyen megoldásokra lehet szükségünk és első sorban tkp. a Google Analytics-et kiegészítő szolgáltatásokat érhetünk el mint pl. polaritás mérés (sentiment analysis - azaz érzelmi viszonyulás mérése), churn és upsell elemzés ami kifejezetten hasznos lehet az e-kereskedelmi oldalak számára a megszokott klasszifikáció, spam- és biztonsági szűrés mellett.

A Google IO konferencián nagyon szépen körbejárták miképp lehet a Prediction API segítségével okos alkalmazásokat készíteni. Természetesen a Google szerint mindenre jó a saját termékük, mi inkább azt mondanánk, hogy sokak számára (különösen a kkv szektorban) jelent belépő szintű megoldást, hiszen az "alap" feladatokat remekül elvégezi a Prediction, de nehéz finomítani és testre szabni. Az analitika addiktív, ha egyszer egy kérdésünkre választ kapunk, az további ezret szül és ezek megválaszolásához még nem áll rendelkezésre kész termék.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

newsle - közszájon forog

2012.08.14. 12:00 Szerző: Zoltán Varjú Címkék: keresés realtime valósidejű keresés newsle

Úgy tűnik ez a nyár a valósidejű keresésről szól. Ezen a héten a newsle-t vettük górcső alá. Nagyon érdekes megközelítést alkalmaz a newsle, ugyanis személyekre fókuszál, s a barátainkkal, kedvenc hírességeinkkel kapcsolatos híreket gyűjti.

newsle00.png

Jelenleg regisztrálhatunk egy email címmel, Facebook vagy LinkedIn azonosítóval.

newsle03.png

Bármelyik útját is választjuk a regisztrációnak, később még társíthatjuk közösségi médiás fiókjainkat a newsle-val.

newsle04.png

Szintén nagy előnye az oldalnak, hogy a gmail címjegyzékünket is importálhatjuk az oldalra, s így azokat is figyelemmel kísérhetjük, akikkel levelet ugyan váltottunk, de a közösségi hálókon nem vagyunk kapcsolatban.

newsle05.png

Belépés után a képernyő nagy részét az ismerőseinkkel kapcsolatos hírek foglalják el a "Friends" fül alatt. Baloldalt egy ad hoc osztályokba sorolva "leghíresebb" ismerőseink, egyéb trendi személyek és további híres személyek között bóklászhatunk.

newsle06.png

A "trending" és híres kategóriában szűkíthetjük a minket érdeklő emberek körét.

newsle08.png

Áttérhetünk az "Everyone" fülre is, ám akárhogy próbálkoztunk itt nem láttunk nagy különbséget az előző oldalhoz képest. Ránézésre úgy gondoljuk, hogy az itt megjelenített információ többé-kevésbé véletlenszerűen tér csupán el a "Friends" fültől.

newsle09.png

Lehetőségünk van böngészni az emberek, jobban mondva a hozzájuk kapcsolódó hírek között.

newsle10.png

Létrehozhatjuk saját adatlapunkat is. Különösen tetszett, hogy a Twitter fiókunkat is megtalálta a newsle rá se kérdezve azonosítónkra közben.

newsle12.png

A keresés tényleg időben releváns tartalmakat talál meg, több személyre is rákerestünk és bizony még a magyar politikusokkal is remekül elboldogul. De a legjobban a celebekkel kapcsolatos információkat lehet követni ezen az oldalon.

Nyilvánvaló, hogy igény van a valósidejű keresésre, hisz a rt.ly, a bottlenose és a newsle is sikeresen vont be kockázatitőkét. Egyértelmű iránynak tűnik a közösségi média alkalmazása is, sőt a newsle megközelítése kifejezetten ötletes. Érdekes végiggondolnunk azonban milyen "híreket", információkat kapunk így, mennyire bízunk a közszájon forgó hírekben a való életben. Mi a pletyka?

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

Mi köze van a palackorrú delfineknek a valósidejű kereséshez?

2012.08.07. 12:00 Szerző: Zoltán Varjú Címkék: bottlenose valós idejű keresés realtime keresés

Mi köze van a palackorrú delfineknek a valósidejű kereséshez? Mielőtt rávágná valaki, hogy semmi, látogasson el a bottlenose oldalára.

bottlenose07.png

A bottlenose az öreg kontinensen született, Amszterdam kedvező startup klímájában nőtt fel a nyilvános béta verzióhoz, mint a blogon nemrég bemutatott Silk. A múlt héten ismertetett rt.ly-val ellentétben nem csupán a bit.ly-n rövidített linkek között keres, hanem szinte minden közösségi médiával összeköthetjük (Twitter, Facebook, G+, de még RSS olvasónkat is becsatornázhatjuk a bottlenose-ba).

Szinte bármelyik közösségi média azonosítónkkal regisztrálhatunk és később a többit is társíthatjuk bottlenose fiókunkhoz. Belépéskor általában egy kicsit várnunk kell - sőt, nekünk egy-két esetben egy percnél jóval többet kellett malmoznunk.

bottlenose09.png

Várakozásunk jutalma egy dashboard, ami manapság nagyon divatos, csak éppen gyakorlatilag áttekinthetetlen. Hol van ez a Prismatic letisztult egyszerűségétől, vagy a Wavii áttekinthető felületétől?

prismatic.png

Szerencsére viszonylag hamar meg lehet barátkozni a kuszasággal és akár élvezni is lehet a trendi témák felfedezését. Lássunk egy példát!

bottlenose10.png

Belépéskor már rögvest éltünk a gyanúval, hogy valahogy rájöttek honnét nézzük az oldalt. Az olimpia mellett már a várkozás során megjelentek a "Hungary" és "waterpolo" kulcsszavak (második kép). Ezen indultunk tovább. Mi arra voltunk kíváncsiak, hogy "Hungary"-re kattintva, milyen híreket ajánl fel nekünk a bottlenose. Az eredménnyel félig vagyunk elégedettek.

bottlenose.png

Visszatérve a dashboardra már egy frissült oldal fogadott minket és jobb oldalt megjelentek különböző streamjeink is.

bottlenose02.png

A streamek között bogarászva még jobban elszédültünk. Aki szeret pepecselni az biztos örül az ilyen részletes Twitter feednek, de nekünk ez sok.

bottlenose04.png

Azon túl, hogy nem kell elnavigálnunk az oldalról, nem sok értelmét láttuk a Twitter csatorna megjelenítésének sem.

Nem törünk pálcát a bottlenose felett, hiszen ötletes termékkel álltak elő, ami még nyilván finomodni fog a jövőben. Külön ötöst érdemel, hogy tényleg szinte minden fontos hírfolyamot integrálnak. Csak talán túl sokat akarnak. El kellene dönteniük, hogy a rt.ly-t vagy a Prismatic-et akarják megverni. Ha ez sikerülne, akkor még esélyük is lenne. Jelen pillanatban inkább durván közösségi média függő felhasználóknak és/vagy profiknak ajánlható a rendszer.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása