HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

John Batelle: Hogyan fog kinézni a keresés mobil eszközökön?

2014.12.26. 15:40 Szerző: kereso Címkék: mobil interfész felhasználói felület interface tervezés mobil keresés kontextus app kereső

Számos érdekes startup cégre bukkantam, miközben a mobil-világ megértésén tüsténkedtem. Az iram csak gyorsult, ahogy az alapítók elkezdték felfedni műhelytitkaikat. Ahogy az várható volt, rengeteg ember fáradozik érdekes dolgok létrehozásán - olyan szolgáltatásokon, melyek már eleve feltételezik, hogy a mobil-keresés fennálló rendszere nem fog sokáig állni. Lenyűgözőnek és további vizsgálatra alkalmasnak találom ezeket.

A legutóbbi a Jack Mobile, egy titokban feltörekvő startup, melyet a korábbi Facebook- és Apple-alkalmazott, Charles Jolley alapított Mike Hansonnal kb. egy éve, a Mozilla és a Cisco főmérnökével, aki korábban a Sherlock keresőalkalmazás 1.0-ás verzióját írta Apple-re.

mobilkereses.jpg

Linkelnék valamit a Jack-ről, de egy oldalnyi általános információn kívül semmit nem lehet róla olvasni. Most, hogy Charles és Mike bevezettek a műhelytitkokba, lenyűgöző dolgokról tudok beszámolni, melyek rávilágítanak a poszt-webes világ keresési-, és az alkalmazások interfész-problémáira. Ha sikerül elrugaszkodni az asztali PC előtti üldögélés képétől, hogyan nézne ki a keresés? Mi a keresés maga, amikor az ember ezt a telefonján, az óráján, vagy bármilyen más, ráaggatott készüléken teszi?

A Jack megpróbál ezen kérdésekre válaszolni, és a csapat újragondolja az interfész alapvető felépítését is.

A keresés mobileszközökön eleve “génhibás”. A webes keresés alapvetései - melyektől működni tud az egész - egyszerűen hiányoznak a mobilokon. A telefonunkon nincsenek indexelhető linkek vagy nyilvánosan elérhető weboldalak gyűjteménye, melyeket szabadon lehetne analizálni vagy keresőrobottal követni. Csak izolált, a nagy levesben kavargó, egymástól független alkalmazások halmaza van, melynek elemei mind csak a saját funkciójuk betöltésére hivatottak. De ez nem jelenti azt, hogy ne lenne szükségünk keresésre a mobilokon, sőt, nagyon is sokat keresünk rajtuk. De a kapott eredmények nem valami felemelőek. Ez főleg azért lehet, mert a telefonunk a  keresésre a webről szedi a választ. De ahogy arra Jolley és Hanson rámutatott, ezek a válaszok nem megfelelőek a mobil kontextusában.

Webes- kontra mobilkeresés

 

Webes keresés Mobilos (poszt webes) keresés
Kontextus információ alapú szükség alapú
Keresőkifejezés Meghatározó (mi, ki, hol, miért) Tett vezérelt (hogyan tudok, mit tudok, hol tudok, miért (nem) tudok)
Korpusz Teljes (találd meg, amire szükségem van) Javasló (Találj valami releváns információt)
Kulcsszignál Link(ek) Személyes háttér (kontextus)
Felhasználói felület Parancsalapú Társalgás jellegű
Személyre szabás Keresési történet App használat, helyszín, kontextus

 

A mobilkeresések egyszerűen mások

 

Kontextus: Amikor a telefonunkon keresünk (vagy bármilyen, helyhez nem kötött eszközön) nagy valószínűséggel teljesen más szituációban vagyunk, mint a “weben”. A mobilos keresések szolgáltatásokhoz kötődnek, pl. “Hogyan jutok el erre a címre?” és/vagy helyszínhez kötöttek, pl. “Milyen jó szállások vannak a közelben?”

Keresési kifejezés / Korpusz: A kontextus-különbözőség miatt a keresésünk tárgya rendkívül leszűkül. A mobilkereséseknek általában egy találata van. Nem egy linkhalmazt várunk, amit aztán átböngészhetünk, hanem a konkrét helyzetünkre vonatkozó választ szeretnénk. A mobilkeresések ezért inkább a szolgáltatások és a tettek felé mozdulnak el a keresési kifejezések oldaláról. Ez azt jelenti, hogy a keresés teljessége elé gördülő, vélelmezett akadály (az ár amit pl. a Google fizet a teljes Internet RAM-ban tárolásáért) mobilokon egyáltalán nem hátrány. Nincs szükségünk az összes, lehetséges, indexelt információra, csak az éppen megfelelőre. Hogy ez milyen információ? Ez a következő pontunk.

Szignál: Mobilon olyan új szignálok  is rendelkezésre állnak, melyek extra információként szolgálhatnak (és kellene szolgálniuk) a relevánsabb keresési találatok érdekében (de nem teszik). Az egyik ilyen fő szignál az aktuális helyszín. Aztán ott van még a helyszíntörténet (merre jártunk korábban), a telefonra letöltött alkalmazások, azok használatának története és alkalmazási módja, ami rá is vezet következő pontunkra.

Felhasználói felület: A keresés mobilon jelenleg megegyezik webes társával. Parancssoros interfész, ahova begépelhetjük a kereső-kifejezésünket, amire kattintható linkeket kapunk válaszul. A Google keményen dolgozik ennek megreformálásán és általános keresőjének - ami képes előhozakodni az “egy igaz válasszal” - hang-alapú kereséssel való kombinálásával nagyot lépett előre. De a Jack-es srácok egy egészen másféle interfésszel hozakodtak elő, amelyet rendkívül izgalmasnak találok. Nevezzük a megközelítést “társalgásnak”.

A társalgási kereső-interfész

 

2004-ben találkoztam Gary Flake-kel, aki akkor az Overture  - korának vezető kereső cége, amit a Yahoo később felvásárolt, ami ezáltal egészen a Microsoft általi bekebelezésig volt a Yahoo kereső “lelke”) - senior technikai vezetője volt. Már akkor is, amikor a mobilos keresés maximum csak hírből volt ismert, bosszantott a kereső-interfész.

Megkérdeztem, hogy miért nem tudunk előrébb lépni a keresésben, mivel a “tíz kék link” megközelítés olyan semmilyen volt. Fel akartam tenni egy kérdést, válaszokat kapni, majd új kérdést feltenni. Vagy még inkább: azt akartam, hogy a szolgáltatás tegyen fel nekem kérdéseket, pl. “A ‘jaguár’-ra kerestél. Az állatra, az autóra, a focicsapatra, vagy valami másra gondoltál?” Gary búslakodva rámnézett és olyasmit mondott, amit soha nem felejtek el: “Ha csak egy modális ablakom lehetne…”

Ezt arra értette, hogy akkoriban a keresés a tíz legjobb linkért való versengés volt, és bármi, ami ennek az útjába került - úgy mint egy felugró dialógus-ablak, amivel a keresést lehetett volna finomítani - visszatartó erejű volt az alkalmazás használatával szemben. És amennyivel kevesebben használják, annyival kevesebb a bevétel.

De az ötletet - az oda-vissza kérdezéses keresést, társalgást, ha úgy tetszik - nem tudtam kiverni a fejemből. Így talán elképzelhető meglepődésem, amikor Jolley és Hanson megmutatta a Jack Mobile kereső interfészének korai prototípusát, ami olyan volt, mint egy párbeszéd.

Megkértek, hogy ne áruljak el részleteket  az interfészről, elég az hozzá, hogy egészen újszerű, és sokkal inkább oda-visszakérdezős, mint bármi más a weben jelenleg. Kellemes, és menő a használata. A Jack tudja hol vagyunk, így ha rákérdezünk arra, hogy “A Galaxis Őrzői”, megmutatja a vetítési időpontokat a közelünkben találatként. Ha arra kérdezünk, hogy “olasz éttermek”, nem egy listát ad Google+ értékelések alapján, hanem a közelünkben található éttermeket, esetlegesen értékelési sorrendben, amennyiben mondjuk GrubHub vagy OpenTable alkalmazás van a telefonunkon.

Tanulságok

 

A Jack még mindig nagyon korai stádiumban van, de alapítói számos kulcsfontosságú megállapítást tettek eddig is. Az egyik a teljességgel kapcsolatos. Míg a “hosszú farok” (ritkán előforduló keresések) esetek nagyon jelentősek a webes keresésekben, addig a mobilos keresés közvetlenül a lényegre koncentrál, ami azt jelenti, hogy szűkíthetjük indexelésünket és algoritmusainkat, úgy, hogy közben még mindig eredményre vezet a keresőkifejezések nagy része.

A mobilos keresés ugyanakkor nagyban személyre szabott. Nincs egy, általánosan megfelelő találati lista. Mobilon az alapján kell rangsort felállítani, ami a felhasználó számára leginkább célravezető, nem abból kell kiindulni, hogy valamely külső rangsoroló rendszer mit ítélt meg mérvadónak. A “3-as BMW” kifejezésre keresve más eredményt kell, hogy kidobjon a Mercedes szalon mellett, mint a főút menti gyorsétteremben. Noha a személyre szabott keresés a Google+ egyik legfőbb jellemvonása, az igazság az, hogy elég halovány a próbálkozásuk. A weben rettentően keveset tud rólunk a Google. Annál többet a telefonunk. Mindezen adat felszabadítása még mindig nagyon nehéz, de nincs már messze.

A Jack megközelítésének egyik legérdekesebb vonzata azonban az lehet, hogy hogyan kavarja fel az ökoszisztémát a “publikálók” és a “közönség” között. Hanson rámutat arra, hogy a webes keresés a fogyasztóról szól, a tartalom előállítója sokadrangú utas a történetben, nehéz helyzetbe hozva magát: állandóan tudatosítani, publikálni kell jelenlétét a weben, vagy elnyeli a jelentéktelenség mocsara. Mindenesetre teljesen az ismeretlen működésű varázsdoboz jóindulatára vagyunk bízva, amikor arról kezdünk agyalni, hogyan is találhatnak meg minket a weben. Hanson egészen másféle modellt vázol fel a Jack indexelési elvéhez. Olyat, melyben a publikálók app- és tartalmi struktúrájukat megadott query-típusokhoz címkézett, különbejáratú feedjeiken kézbesítik a Jack-nek. Ha  ez úgy hangzik, mint a szemantikus keresés, nem véletlen. Hanson, aki a Mozillánál eltöltött ideje alatt a nyílt webes szabványok élharcosává nőtte ki magát, elárulta, mély sebeket hord a témával kapcsolatban. Ugyanakkor az az érzésük Jolley-val egyetemben, hogy egy újfajta játéktér jöhet létre, mely ténylegesen lehetővé teszi a szemantikus, személyre szabott keresést.

A Jack több kérdést vet fel mint amennyit megválaszol, de éppen ettől érdekes. Itt van egy kicsi, jól finanszírozott, kereső-, web-, és mobil-szakértőkből verbuvált csapat, akik ténylegesen új megközelítésből tekintenek egy problémára/lehetőségre. Erre mindenképpen oda kell figyelni 2015-ben.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Dec. 18. Évadzáró NLP meetup

2014.12.15. 07:25 Szerző: zoltanvarju Címkék: Neticle NLP meetup Precognox Kilgray

Évadzáró meetupunkat csütörtökön (december 18-án) tartjuk, a szokott helyen (Colabs-Buda) 18:00-tól. Érdemes eljönni, mert februárig kell várni a következőre! A részvétel továbbra is ingyenes, de arra kérünk mindenkit, hogy regisztráljon az esemény oldalán.

logo9_final.jpg

Az évad utolsó rendezvényén nyelvtechnológiai cégek mesélik el hogyan indultak, milyen nehézségekkel kellett szembenézniük és képet kaphatunk arról milyen is az az igazán nagybetűs élet ebben a világban. A bemutatkozók:

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

NLP nap a Precognoxnál - avagy mit is csinálunk mi?

2014.12.12. 21:35 Szerző: zoltanvarju Címkék: nyelvtechnológia Precognox

Ma kutatói napot tartottunk, amin megbeszéltük az aktuális projekteket és jövő évi terveinket. Sokan szokták kérdezni, hogy mivel is foglalkozunk, hogyan dolgozunk - ami ebből nyilvános, azt megtaláljátok alábbi diáinkban (ígérjük, idén már nem lesz több slideos poszt!).

nlp_team.jpg

Az idei év legfontosabb változása az, hogy immár egy komplett csapat foglalkozik NLP és gépi tanulás K+F projektekkel, őket láthatjátok a fenti képen (balról jobbra Szabó Martina, Kása Károly, aki a fejlesztési vezetőnk, Varjú Zoltán, Balogh Kitti, Morvay Gergő). A kutatói napon munkatársaink összefoglalták, hogy milyen projekteken dolgoznak éppen.

 

Szabó Martina nyelvész szakértőnk 2014 márciusában csatlakozott csapatunkhoz és azóta már több projektünkben is aktívan részt vett. Fő kutatási területe a szentiment- és emócióelemzés , amiben Morvay Gergő gyakornokunk segíti őt. Martinának köszönhetően cégünk egyre gyakrabban jelenik meg tudományos konferenciákon és a szakma publikációiból is megismerheti ezen projektünket.

 

Balogh Kitti statisztikusunk 2014 márciusában csatlakozott csapatunkhoz és több projektben is bizonyított már cégünknél. Amennyire fontos a tesztelés a szoftverfejlesztésben, legalább annyira fontos a gépi tanulási algoritmusok kiértékelése. Célunk, hogy munkánk része legyen a kiértékelés és minden olyan projektünk esetében a használt modellek kiválasztásától kezdve a végtermék kiértékeléséig szigorú metodológia mentén járjunk el, Kitti ebben segíti munkánkat.

 

A politikai blogokkal kapcsolatos sorozatunkat lelkes olvasóink már ismerhetik. Kitti a tartalomelemzés és a linkanalízis összekapcsolását kitűző projektünkkel kapcsolatos terveit is ismertette.

 

2015-ben izgalmas feladatok várnak ránk, ígérjük mindenről beszámolunk majd (ami nyilvános).

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A LingDokKonf 18. diái

2014.12.09. 08:26 Szerző: Szabó Martina Katalin Címkék: konferencia szentimentelemzés LingDok

A Szegedi Tudományegyetem Nyelvtudományi Doktori Iskolája minden évben meghirdeti a Nyelvészdoktoranduszok Országos Konferenciáját. A tizennyolcadik LingDok konferenciára 2014. november 20-án és 21-én került sor, az SZTE Bölcsészettudományi Karának Konferenciatermében. 

A konferencián "A magyar nyelvű szövegek szentimentelemzésének dilemmái, különös tekintettel a szentimentsifterek kezelésére" címmel tartottam előadást, amelyben igyekeztem a szentimentelemzés NLP-feladatát a kardinális elméleti problémák felől is megvizsgálni.

Az előadás diáit ebben a posztban közzé is tesszük. Továbbra is örömmel fogadunk minden észrevételt, kérdést és ötletet azoktól, akik hozzánk hasonlóan rendkívül izgalmas és nagy kihívást jelentő kutatási témának tekintik a szentimentek kivonatolását a magyar nyelvű szövegekből! 

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A novemberi NLP meetup diái

2014.11.29. 11:19 Szerző: zoltanvarju Címkék: meetup nyelvtechnológia NLP meetup

A csütörtöki meetupon valószínűleg rekord látogatottságot értünk el, köszönet Recski Gábor szervezőnek, az előadóknak és persze nektek kedves tagok! A diákat megtaláljátok alább:

Simon Eszter: A hun* eszközlánc szószintű feldolgozó eszközei 

Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunk

 

 

Miháltz Márton: Közösségimédia-szövegek feldolgozásához adaptált Hun* eszközök 

 

 

Orosz György: Egy adaptálható morfológiai egyértelműsítő rendszer

 

Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnevek és többszavas kifejezések

 

 Farkas Richárd: Információk automatikus kiemelése magyar nyelvű szövegekből 

 

Pólya Tibor: Regresszív Képzeleti Szótár - Narratív kategorikus tartalomelemzés 

Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítve 

 

 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre