HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Keresés vs felfedezés

2011.02.03. 16:16 Szerző: Kereso75 Címkék: alternatív keresőfelület keresés problémái ajánlórendszerek

Tény mi tény, nem minden esetben a keresés a legjobb megoldás a problémáinkra. Ha nem konkrét kérdésre konkrét választ várunk, hanem például a környéken található éttermek közül azt szeretnénk megtalálni, amely a legjobban hasonlít az általunk kedveltekre, akkor más megoldás kell. Vagy éppen szeretnénk egy olyan könyvet vásárolni, amit a hozzánk hasonló érdeklődésűek tartottak érdekesnek.

Mit lehet ilyen esetben tenni? Ilyenkor segíthet egy a korábbi választásainkat figyelembe vevő ajánlórendszer, amilyen a magyar fejlesztésű Gravity megoldása is. Petres Zoltán előadását személyesen is láttam a nyílt napjukon a héten, ami ezt a témát dolgozza fel:

Persze az ilyen rendszereknek is megvannak a maguk korlátai, melyek egyikére éppen egy helyszíni kérdező hívta fel a figyelmet. Az ajánlórendszer könnyen egyfajta irányba állítja be az érdeklődési körünket. Ezt magam is tapasztalom, mint rendszeres Amazon vásárló, hogy bizony hajlamos beskatulyázni az ajánlójuk néhány korábbi választás alapján.

Ezért gondolom azt, hogy a jó kereső és a jó ajánlórendszer együtt ad olyan megoldást a legtöbb alkalmazás (például webshopok) esetén, ami a különböző felhasználási igényeknek egyaránt megfelel.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

"Copy, right?" - avagy puskázott-e a Microsoft, és ha igen, jó emberről tette-e?

2011.02.02. 11:36 Szerző: Vajda Gábor (Gabor_V) Címkék: google keresés internetes keresés bing

A Google hivatalos blogján két nappal ezelőtt egy cikket jelentetett meg, amelyben azt próbálja bebizonyítani, hogy a Bing a Google kereső találati eredményeit másol(hat)ja.

Meg is indult a lavina és az egymásra mutogatás.

Természetesen reagált a Microsoft Bing-es részlege a vádakra, melyben természetesen tagadnak mindent, hozzátéve, hogy egyébként minden felhasználójuktól gyűjtik az adatokat ezer másik különböző megoldás mellett a találati lista sorrendjének kialakításában.

A ZDnet gyenge lábakon állónak tartja az érveléseket, hiszen a Google által végrehajtott teszben kevesebb mint 10% volt az egyezés, sőt, azzal vágnak vissza, hogy lényegében a Google Chrome is hasonlóképpen jár el.

Szintén a ZDNet-en megy arróla vita, hogy ha igenis másol(t) a Bing, az csakis előnyére válhat hosszútávon mindenki számára, hiszen így könnyebb akár hibákat is felfedezni a rendszerben, amellett, hogy az adatbázis is nagyobb lesz.

A Search Engine Watch érdekes és elgondolkodtató felvetése  az is, hogy a teszt egyértelműen azt bizonyítja be többek között, hogy a Google igenis manipulálhatja a sorrendezést a találati oldalon, hiszen pontosan ezt tették saját adatbázisukkal, hogy kiderülhessen a Bing esetleges csalása.

Anélkül hogy pálcát törnénk egyik vagy másik cég feje fölött, a végszót egy hup.hu-s fórumhozzászólásnak adnánk, miszerint "egy jó kereső a többiben is keres". :)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Autót keresek: hogy lehetne jobban?

2011.01.19. 08:44 Szerző: Kereso75 Címkék: autókereső

Saját problémám, miszerint éppen hétszemélyes egyterűt keresek adta az inspirációt, hogy újra figyelmesebben megnézzem a Használtautó.hu keresőt, ami itthon az első számú oldal a témában. Utoljára 2008 augusztusában írtam róluk, amikor megdicsértem az akkoriban  korszerűnek mondható felületüket.

Örülök annak, hogy azóta legküzdötték a legsúlyosabbnak mondható hiányosságukat, most már az autó modelljét előre meghatározott listából lehet választani. Megoldottak egy másik, a kommentelők által akkor felvetett kérdést is, fölrajzi hely is kereshető. Ezeken kívül is sok szűrési opcióval bővültek.

Kérdésem: mi hiányzik nektek a meglévő autókereső oldalakból?

Nekem két szempont jutott eszembe, amire jelenleg nem lehet keresni, és nagyon hasznos lenne:

1. "Újonnan Magyarországon üzembehelyezett". Ezzel rengeteg esetben az autók többségét ki lehetne szűrni.

2. Másrészt hasznos lenne az autó modellek adatait (fizikai méretek: szélesség, hossz, gépkönyv szerinti átlagfogyasztás) is az adatbázis részévé, és persze kereshetővé is tenni.

Twitteres kommentek a kérdésre:

- @baaders: nekem meg pont olyan kellett volna hogy áfás-e.. vagy számla-e hozzá (céges stb) jó lett volna..

- @Sera: Olyan filtert látnék szívesen, hogy magánszemély

- @GeeHalen: Statisztikák: pl elégedettség a Népítélettől átvéve

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

State of the Empire - a Birodalom helyzete

2011.01.10. 10:51 Szerző: Vajda Gábor (Gabor_V) Címkék: google spam keresés internetes keresés

Az elmúlt időkben egyre erősödtek a Google keresési eredményeit kritizáló hangok. Míg a cégóriás a számítástechnika és az Internet minden sarkában ott van - és még azon kívül is, ld. pl. a kísérleti önjáró autót -, úgy tűnik, éppen a vállalat gerincét jelentő Google kereső és egyéb más keresési szolgáltatásai küzdenek jelenleg problémákkal.

Jelen állás szerint - kereséssel élve - egy adott weboldalra közel 90%-ban a Google keresőn jutnak el az emberek. Ez hatalmas felelősséget jelent a cég számára ha releváns információkhoz akarja juttatni az alkalmazást igénybe vevőket. Márpedig úgy tűnik, éppen ebben hibádzik.

Mielőtt azonban kifejtenénk, kicsit dőljünk hátra és nézzünk meg egy rövid jelenetet a Monty Python repülő cirkuszából, amely tökéletesen, szó szerint írja le a problémát (0:30-tól):

Angolul kevésbé értő olvasóink részére elmondjuk, hogy a jelenetben a "spam" kifjezés a konzerves löncshúsra utal, és mint ilyen, a megjelenített étterem kínálatának csaknem minden egyes pontjában megtalálható, és nem is tudnánk olyat kérni amiben ne szerepelne az említett összetevő.

A Google kereső nyugati igénybevevői is egyre nagyobb számban ütköznek a spam problémájába a találati listát illetően. A magyar nyelvű Google ilyen szempontból kevésbé releváns, hiszen egészen kis szeletét jelenti a teljes cégóriásnak, talán kisebb figyelem is összpontosul ide (bár a magyar csoport nagy erőfeszítéseket tesz ezek kivédésére). Az azonban meglehetős belső gondokra vagy egyszerű oda nem figyelésre utal, ha az angol nyelvű találatok közé is egyre nagyobb számban férkőznek be a spamek.

A kritikus hangok többsége az ún. "scraper site"-ok (talán "túszejtő oldalnak" nevezhetnénk magyarul) felülreprezentáltságát emeli ki. A túszejtő oldal egy másik oldal tartalmát lemásolja, majd ugyanazt jeleníti meg saját felületén, "pénzt követelve" érte - vagyis reklámokat helyez el mellé. Ha azonban minél több reklám (kiváltképpen ha Google hirdetésekről van szó) és rengeteg más, amúgy oda nem illő cimke szerepel a tartalommal kapcsolatosan, a kereső hajlamosabb a túszejtő oldalt a keresési eredménylistában előbbre helyezni mint az eredetit.

Ez pedig károkat okozhat mind a tartalmat eredetileg előállító oldalnak (mivel a forgalom nem oda megy), mind a keresőnek egyaránt (a látogatókat eltántorítja).

Olyan véleményeket is lehet már olvasni, hogy a Bing is jobb eredményeket szolgáltat, de a Microsoft szolgáltatása egyértelműen abból a hátrányból indul, hogy lényegesen kisebb a "lefedettsége", szűkebb tartalomból lehet válogatni. A Google használata már csak ezért is nélkülözhetetlen.

A probléma természeténél fogva két részből áll. Mivel egy többé-kevésbé egyszerű keresési algoritmus felülvizsgálatról és javításról van szó (ami elméletileg nem okozhat túl nagy fejtörést), a teher a másik oldalra helyeződik át, vagyis a Google miért nem tesz/tett valamit korábban ennek kivédésére, miért várta meg az elégedetlenkedők hangját?

Márpedig ez az a kritika amelyet a legtöbben felvetnek, hiszen a szakmához valamennyit is értők egyöntetűen elismerik, hogy 100%-os rendszert soha nem lehet készíteni. Így mindig lesznek olyanok, akik megtalálják és ki is használják a törésvonalakat.

Valószínűsíthető, hogy a cég rakétaerejű növekedése következében előállt figyelem, teendők és prioritások túlzott megosztása a baj gyökere. Ez önmagában egy természetes jelenségnek tudható be, azonban arra minden cégnek oda kell figyelni, ha a vállalat alapját, kiindulópontját fenyegeti ilyen veszély.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

Mit hoz 2011? John Battelle előrejelzései

2011.01.04. 11:43 Szerző: Vajda Gábor (Gabor_V) Címkék: microsoft google mobil apple facebook john battelle internetes keresés keresés jövője groupon

Éves előrejelzéseim nyolcadik kiadásában megpróbálok összpontosítani és tisztán gondolkodni, hogy egy év múlva jobb pontokat szerezzek magamnak. S míg az elmúlt két  hét sekélyes ünnepi periódusát féktelen lakmározással töltöttem, az igazság az, hogy ezt az előrejelzést együltőmben vetettem írásba, csakúgy, mint ahogy azt az elmúlt hét évben tettem. Ez eddig bejött számomra és remélem az olvasó is egyet fog érteni velem, vagy legalább is nem találja kidobott időnek ezen cikk átolvasását. Nos, valahogy így gondolom:

1. Egy új mém (jelenség) felemelkedését figyelhetjük majd meg, melyet "a web újjászületéseként" nevezek. Válasz arra a felvetésre, hogy a mobil készülékek és alkalmazásaik megölték a jól ismert formátumú webet. Valójában rájövünk arra, hogy a web majdnem minden tettünk alapjává válik és fogyasztói elvárásaink támadnak szolgáltatóink felé, hogy tartsák szem előtt és valósítsák is meg a "web barát" alapelveket - főként az adat hordoztathatóságát és a felhasználó által uralt személyazonosságot. Nevezhetjük ezt a Web2 eredeti koncepciójának visszatérésének.

2. A hangvezérlés kiemelt szerepet kap majd a felhasználói felületek kezelésében - különösen a mobilalkalmazások esetében. Ez nem csak most igaz, de egy év múlva maroknyi olyan népszerű applikáció lesz a piacon, melyek hang által, vagy kifejezetten hang, szöveg és személyazonosság együttese által lesznek vezérelhetőek.

3. A DSP hirdetéskezelő rendszerek beleszürkülnek, beleolvadnak a nagyobb marketing platformokba. Végeredményben a DSP-k azok, melyek alatt a technika által vezérelt hirdetési hálók koncepcióját értjük. Ezek már egy évtizede velünk vannak. DSP-k, SSP-k, stb. mind fontosak, de ami végül számítani fog, az az, hogy mekkora hirdetőkről van szó és milyen a hatékonyságuk, ill. a fogyasztóknak mekkora kontrolljuk van.

4. Ehhez kapcsolódóan a MediaBank jelentős független játékosként fog felemelkedni a marketing világában, megjátszva keresztcsatornás kapcsolatait (a digitálison kívül) és alternatívát kínál a vegyes szájízű digitális felüleletek helyett a Facebook-on, a Microsoftnál, a Google-nél és a Yahoonál. El tudom képzelni, hogy egy nagyobb technológiai vagy telekommunikációs játékos megpróbálja felvásárolni a MediaBank-et, miként a világ rádöbben, hogy a marketing lényegét érintve nem más, mint egy gigantikus információs technológiai üzlet (egyéb más dolog mellett).

5. A Mac App Store nagy siker lesz - legalább is a Mac-esek között - és várakozásokon felüli mértékre pörgetheti a Mac eladásokat.

6. Ehhez kapcsolódóan az Apple meg fog próbálkozni a közösségi hálókban való megerősödésre, elbukik és üzletet köt a Facebookkal.

7. Szinten ide kötődik, hogy az Apple ugyanazon problémák jeleit fogja mutatni, amitől a Microsoft is szenvedett a 90-es években, vagy akár a Google pár évvel ezelőtt: túl nagyra nő, önteltek lesznek és túlságosan korábbi sikereikre fókuszálnak majd.

8. A Microsoftnál lényeges személyi változások lesznek a vezetőségben Nem jóslom, hogy Ballmer távozna de úgy gondolom, hogy a cég minden valószínűség szerint új, vezető tehetséget fog behozni, hogy új piacokat nyisson és irányt változtasson olyan fontos területek felé, mint a média, marketing, ill. a közösségi háló.

9. A nyilvános piacok meglepően nyitottak lesznek a nagyobb Internetes üzletekre, a jelenlegi magán részvénykibocsátások és a kezdeti részvénykibocsátások menetének megtörésébe vetett hit ellenére. Végül nem lesz túl sok jó érv a nyilvános cégek számára amellett, hogy azok is maradjanak.

10. A táblagépek számára egy év útkeresgélés lesz megfigyelhető. Az Apple uralni fogja a piacot az iPad-del válaszható alternatíva hiányában. A Google arra fog fókuszálni, hogy világos, következetes élményt nyújtson táblagépekre és mobilokra az Androidon keresztül, de egy harmadik félre lesz szüksége, hogy egyesítse az élményt. Nem hinném, hogy ez még az idén bekövetkezne.

11. A "közösségi üzletek" átalakulnak olyan módon, hogy általános marketing megnyilvánulási formák legyenek minden üzlet számára, és hogy az év végére bármely hirdető médiamixének állandó szereplői legyenek. A Groupon fog itt vezetni, de majd' minden nagyobb játékosnak lesz ajánlata, sokszor a vezetőkkel partnerségben. Csábító gondolat, hogy a Facebook felhagy saját "Deals" ajánlataival egy, a Grouponnal való együttműködés érdekében, de nem tennék rá, hogy ez egy év alatt megvalósulna.

12. Ide kapcsolódóan a Groupon el fog utasítani minden felvásárlási szándékot, mely olyan nagyobb cégektől következhet be, mint az AT&T vagy a Verizon. Lehet, hogy elkel, de ezt kétlem.

13. A Facebook az Internet világában csökkenni fog mint befolyásoló erő, ahogy azt a felhajtásból sejteni lehet. A céget továbbra is "nagy testvérként" fogja emlegetni a sajtó, és a növekedésből fakadó belső ellentétekkel kell majd megküzdenie. Ugyanakkor némi figyelem, ill. részvénycsökkenés lesz tapasztalható új jövevények javára. A marketingre fordított összege és a kiterjedése azonban növekedni fog.

14. Ehhez kapcsolódóan nagyobb jelentőségű, személyes adatokkal kapcsolatos törvényalkotási próbálkozásokat láthatunk majd az amerikai kongresszusban, melyek azonban egyetértés hiányában elbuknak. De ez jelentős irányváltást hoz abban, ahogy a kultúránk értelmezi az iparunk által épülő világgal való kapcsolatát, és ez jó dolog.

Szeretnék továbbmeni, de úgy gondolom, ezek a főbb pontok, legalábbis az én perspektívámból. Köszönöm a figyelmet, nagyszerű évet tudhatunk magunk mögött. Nem fogok előrejelzéseket tenni erre az évre saját munkámmal kapcsolatban, mivel túl sok belső információval rendelkezem a témakörben. Boldog új évet kívánok!

(A cikk eredetije itt olvasható)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása