HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Reverb - a Wordnik nevet váltott

2013.02.12. 12:00 Szerző: Zoltán Varjú Címkék: ajánló ajánlórendszer nyelvtechnológia korpusznyelvészet big data Wordnik Reverb tartalomajánlók

A mindenki kedvenc online szótárát készítő Wordnik nevet váltott és Reverb-re keresztelte át magát. A zászlóshajó termék továbbra is a Wordnik szótár, az új névvel szeretnék jelezni, hogy immár annak felhasználását helyezik előtérbe. 

Talán a Reverb az egyetlen cég, amihez egy TED előadás adta az ötletet. Persze minden korpusznyelvész - joggal - úgy érzi, az általa összegyűjtött adatok aranyat érnek, de kevés lép a tettek mezejére. Minden startup számára nehéz megtalálni a megfelelő működési modellt, ezért viszonylag gyakran váltanak üzleti modellt (ezt nevezik pivot-nak). A mostani névváltás a második nagy pivot a cég életében. De ez most egyáltalán nem váratlan. Ahogy korábban már bemutattuk, a cég intenzíven kereste azt a területet, ahol hasznosulhatna a lassan már félelmetesen nagy szótára. Most úgy tűnik a tartalomajánló rendszerekben megtalálta a bevételt termelő főtevékenységet.

reverb.png

A Reverb a Wordnik adataira alapozva kínál tartalomajánló szolgáltatást. Az olvasók oldalon tartása egyidős az internettel és máig nincs ideális megoldása. A leginkább elterjedt megoldása a tartalmak címkézésén alapuló ajánlás. A címkézés viszont szubjektív, a "cica" és a "macska" mind ugyanarra vonatkozhatnak, de ha csak az egyiket adja meg a tartalom gondozója, akkor az ajánlórendszer tehetetlen. A Wordnik szótár felhasználásával automatikusan megtalálhatók a példához hasonló kapcsolatok, ezáltal hatákonyabbá válik az ajánlás.

A Reverb nem áll meg a szótára újrahasznosításánál. A cég álláshirdetései alapján látható, hogy az ún. topik modellek területén jártas kutatókat és fejlesztőket keres. Ebből arra következtethetünk, hogy a tartalmak mélyebb elemzése alapján is szeretne jobb ajánlásokat generálni ügyfeleinek. Reméljük az új modell sikeresnek bizonyul és sok korpusznyelvészt fog inspirálni a jövőben. Sok sikert Reverb!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Yahoo! Interest Graph

2013.02.11. 08:32 Szerző: Zoltán Varjú Címkék: mobil e-kereskedelem Yahoo! Interest Graph filter bubble

A Facebook Graph Search elindulásával kapcsolatos hírek között szinte elsikkadt, hogy a Yahoo! is valami hasonlóval próbálkozik. Marissa Mayer CEO a Bloomberg TV-nek adott interjú szerint a Yahoo! célja az érdeklődési gráf kialakításával az, hogy minél személyesebb mobil élményt nyújtson a felhasználóknak.

Habár az interjú nagyon érdekes, érdemes megjegyezni, hogy az érdeklődési gráfok nem most jelentek meg. A leghíresebb talán a Hunch.com, ami 2009-ben indult és immár az eBay tulajdona. Ahogyan arról már korábban beszámoltunk, mind a hagyományos, mind az e-kereskedelem szereplői intenzíven kutatnak és fejlesztenek ezen a területen. Ez nem is annyira meglepő, hiszen számukra létfontosságú egy jól működő ajánlórendszer. Az viszont már egy másik kérdés, hogy mennyire akarjuk magunkat (és a felhasználókat) bezárni egy érdeklődési burokba...

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

BlackBerry és az érintőképernyős szövegbevitel

2013.02.07. 10:18 Szerző: Zoltán Varjú Címkék: interakció nyelvtechnológia szövegbevitel BlackBerry

Előző posztunkba nem fért bele a BlackBerry újítása. A kanadai céget nagyon megviselte az iPhone és az androidos készülékek elterjedése. A cég nevet is váltott, Research in Motion (RIM) helyett, immár termékei márkanevét viseli és a januárban bemutatott új készülékekbe vetette minden reményét (bővebben erről a The Economist-on). A Q10 a cégtől megszokott fizikai billentyűzetet kapta, a Z10 viszont egy manapság elterjedtebb érintőképernyős készülék. Az alábbi videóban is elhangzik, a cég készülékeit az különbözteti meg a konkurensekétől, hogy a leglehetetlenebb helyzetekben is biztosan és könnyen kezelhető a billentyűzetük. Az érintőképernyő esetében ezt ők a Nuance és a Google virtuális billentyűzetéhez hasonlóan működő kétszintű prediktív bevitellel oldották meg. Ellenben a bevitel nem folyamatos a Z10 esetében, hanem elkülönült mozdulatokkal kell "leütni" az egyes betűket. A folyamatos gesztusoknak a szöveg könnyű szerkesztésében jutott szerep, amit eddig mások elhanyagoltak, ezért üdvözlendő a fejlesztés. A Swype és a Gesture Keyboard tesztelése után viszont mi úgy gondoljuk, helye lenne egy BlackBerry készüléken is a folyamatos bevitelnek.

 

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A Twitter felvásárolta a Bluefin Labs-t

2013.02.06. 09:10 Szerző: Zoltán Varjú Címkék: közösségi média nyelvtechnológia big data Twitter Bluefin Labs

A Twitter felvásárolta a Bluefin Labs-t. Talán végre sikerül levetkőznie a cégnek a túlkoros startup imázsát és saját maga is ki tudja aknázni a csiripelők által nyújtott hatalmas adatmennyiséget. Ahogy korábban már hírt adtunk róla, a Bluefin nagyon ügyesen ötvözi a nyelvészet és a kognitív tudomány eredményeit a legmodernebb technológiával a közösségi és a hagyományos média elemzése során. Olvasóink figyelmébe ajánljuk a Technology Review felvásárlás hátterét taglaló írását. Az akvizíció is mutatja, ma kellően érett az ipar arra, hogy a gyakorlatba is átültesse a tudomány eredményeit. Reméljük sok hasonló sikertörténetről hallunk a jövőben. Az alábbi videóban Deb Roy tíz percben összefoglalja mivel is foglalkozik a Bluefin:

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Mobil beviteli eszközök újragondolva

2013.02.05. 12:00 Szerző: Zoltán Varjú Címkék: mobil mobil keresés beszédtechnológia Nexus Google Nuance Swype Guesture Keyboard Nuance Mobile Assistant

Ha hihetünk a technológiai jóslatoknak, az idei év tényleg a mobil éve lesz. A mobil nagy lehetőségeket rejt magában, de egyben nagyon nagy kihívások elé is állítja a fejlesztőket. Az okostelefonok még csupán az utóbbi öt-hat évben terjedtek el és nem alakultak ki az asztali és hordozható számítógépeken már megszokott standard felhasználói interakciók. A Nuance és a Google is újragondolja a bevett kereteket, kezdve a legegyszerűbb dologgal, a szövegbevitellel.

A Swype alapítója Cliff Kushler nem mindennapi figura, hiszen azzal büszkélkedhet, hogy kétszer is megújította a mobil billentyűzetet és szövegbevitelt; először a kilencvenes években a T9 prediktív bevitel megalkotásával, majd a Swype-al, amit 2011-ben 100 millió dollárért vásárolt fel a Nuance. Ahogy a fenti bemutatón is látszik, a Swype virtuális billentyűzetén nem "nyomogatjuk" a betűket, hanem folyamatosan mozgatjuk ujjunkat a bevitel során. A Swype egyszerre figyeli milyen betűket viszünk be és azt, hogy milyen szavakat vittünk be eddig. Ez a kettős kontextus lehetővé teszi, hogy nagy pontossággal eltalálja mit is akarunk begépelni. Persze a statisztikai módszerek nem tökéletesek, de a beépített tanuló algoritmus alkalmazkodik a felhasználó szokásaihoz és nagyon hamar (tapasztalataink szerint már pár óra használat után) növekszik az app pontossága.

A Nuance Mobile Life betekintést nyújt abba, hogyan képzeli el a beszédtechnológia óriása a mobil interakciót. A Swype a Dragon Go hangfelismerővel kiegészítve a mobil keresést könnyíti meg. A Dragon Dictation pedig a hosszabb szövegek bevitelét támogatja.

A legösszetettebb Nuance megoldás kétségtelenül a Dragon Mobile Assistant, ami jelenleg Android platformra érhető el. Leginkább az Apple Siri-hez hasonlít, ami nem meglepő, hiszen a népszerű iPhone alkalmazás is a Nuance beszédtechnológiai megoldásait használja. Hasonló megoldásokkal ma már szinte minden mobil alkalmazás felruházható, mivel a Nuance szolgáltatás formájában elérhetővé tette beszédfelismerő rendszerét.

A Google legújabb Nexus mobil és tábla készülékeinek kampánya az "Ask me anything", azaz a kérdezz tőlem bármit, szlogenre épít. A kereső óriás az olyan fejlesztésekkel, mint a Google Knowledge Graph megteremtette egy válaszkereső alapjait. Ezzel egyidőben az olyan új interfészek, mint a Google Voice Search és a Google Handwrite előre jelezték, hogy az új platform nyújtotta lehetőségek egyre jobban izgatják a cég fantáziáját. Shumin Zhai elismert ember-gép interakció kutató 2011-es "leigazolása" óta mindenki várta a mobil billentyűzet megújítását is. Zhai az IBM-nél fejlesztett ki a Swype-hoz hasonló ShapeWriter-t. Ennek továbbgondolása a Gesture Keyboard, ami a legújabb 4.2-es Android operációs rendszerben már elérhető.

A Gesture Keyboard működése nagyon hasonlít a Swype-ra. A hagyományos "pötyögés" helyett akár egy ujjal is gyorsan, kényelmesen vihetünk be szöveget, ez az applikáció is egyszerre veszi figyelembe a kontextust a szavak és a betűk szintjén. Saját tesztünk alapján azonban semmilyen tanulási mechanizmust nem tapasztaltunk.

A Nuance megoldásaival ellentétben, a Nexus eszközökön a különféle beviteli módok - hang, szöveg - közötti integráció igen csak gyerekcipőben jár. Ellenben a Swype és a különféle Dragon appok néha szörnyen belassulnak. A szöveges bevitel viszont mindkét cég termékeinek esetében nagyon meggyőző és meglepően jól működik. A mobil évére felkészültek a beviteli eszközök, a jövő kérdése, hogy a felhasználók életébe mennyire ivódnak bele ezek a megoldások.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása