HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Főbb témák

adatbányászat (6) adatok (12) adatújságírás (16) adatvizualizáció (17) AI (14) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (48) bing (14) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (15) Google (23) google (57) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (57) kereséselmélet (7) keresés jövője (54) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (6) lda (10) LDA (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (12) metafora (7) mobil (37) mobil keresés (17) Neticle (8) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (28) nyelvtechnológia (73) open data (11) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (47) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (18) szemantikus kereső (9) szentimentelemzés (34) szövegbányászat (15) társadalomtudomány (7) tartalomelemzés (54) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) Twitter (18) twitter (15) vertikális kereső (9) vizualizáció (12) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Seznam.cz

2007.12.11. 08:49 Szerző: kereso Címkék: seznam

Doransky a Seznam-ot, a piacvezető cseh keresőt, portált nézte meg, és teszi fel az általam is már többször feltett kérdést, mi miért nem tudunk jobbat csinálni? Az Alexa - persze egyébként nem túl pontos, de azért az arányokat általában tükröző - adatai alapján a világ 27. legforgalmasabb oldala, és nem csak a Google cseh oldalára, de például a mi elsőszámú oldalunkra az iwiw-re is ráver kb. 300 százalékot.

Érdemes még tudni róluk, hogy az összforgalom igen jelentős része (42 százalék) jön az email rendszerük használatából, és a látogatók 30 százaléka használja magát a keresőt.

A kereső által visszaadott találatok minőségét természetesen nyelvtudás hiányában nem tudom megítélni, éppen ezért nagyon kiváncsi lennék cseh nyelvet ismerők véleményére: milyen minőségűek a találatok a Google cseh találataival összevetve?

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

10 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr61260008

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Kalmi · http://www.etarget.hu 2007.12.11. 11:32:53

Megprobalok valaszolni: a talalatok nagyon jo minoseguek :-) Ez nem meglepo, hisz ha nem lennenek relevansak az eredmenyek, nem hasznalnak az emberek. Egy apro pletyi: az egyik vezeto fejlesztojuk epp most allt at a google-hoz...

Fothy Monika 2007.12.11. 12:22:12

Nem tudom, én személy szerint nem tudom nagyon jó minőségnek nevezni azt, hogy pl. Lg klimatizace (gondolom ezt nem kell magyarra fordítani) keresőszóra a harmadik találat egy klímákkal foglalkozó weboldal látogatási statisztikája található (Toplist)search.seznam.cz/searchScreen?q=lg+klimatizace
Utóbbi időben az új fulltext beindításával nagyon sok gonddal küzd a seznam, gyakoriak a kiesések, múlt héten is Google találatait adta egy ideig. A találatok mellett megjelenő screenshotok hiányoznak, a pozíciók napról napra fel-alá 20-30 pozíciót változnak. Valami nagyon nem stabil jelenleg a seznamban. A seznamon már túlnőtt a cseh internet. Nagyon pici a kapacitása, a nagy oldalakkal nem bír. Próbálkoznak a seznamos fiúk ujítani, lépést tartani... De valahogy nekem az az érzésem, hogy egyre jobban romlik.

kereso · http://kereses.blog.hu 2007.12.11. 15:52:44

Ami miatt nekem az általad említett témánál nagyon tetszik a Seznam, az a tetején levő céges keresőjükből érkező találatok. Szerintem hasznos. A 3. találat valóban kakukktojás, de azért ilyen példákat lehet találni a Google-n is bőven. pl. www.google.com/search?hl=en&q=h%C3%ADress%C3%A9gek+nevei A 2. találat hírességekkel a témát abszolút csak érinti mégis ott van legelől. (Onnan tudom ezt egyébként mert az a céges blogunkon van :)

Fothy Monika 2007.12.11. 16:51:52

Szerintem azért pici különbség van az "Lg klímák" és a "hírességek nevei" kifejezések között. Az Lg klímák kifejezésre elég nagy a verseny, rengeteg releváns találat követi a kakukktojást. Ergo van, lenne mit mutatni. A "hírességek nevei" pedig egy olyan kifejezés, ami nagyon ritkán fordul elő bárhol is. Kész csoda hogy erre a Google mutatni tud valamit :-)
Céges kereső: Felhasználói szemmel hasznos is lehet, de nem minden esetben. Picit túlzásnak tartom a sok reklámot: szponzorált linkek a tetején, szpozorált találatok a céges katalógusból , sklik reklámok oldalt + alul.

kereso · http://kereses.blog.hu 2007.12.11. 17:05:11

Igazad van, hogy nem feltétlenül összevethető a kettő egymással. Nekem például a fogfehérítés szóra sem tetszenek a Google találatai. Mindenesetre érdemes lenne objektív módon (nem látva, hogy melyik eredmény melyik keresőből jön) összevetni a különböző keresők magyar találati minőségét. Tényleg ha valakit érdekelne mint szakdolgozati téma, szívesen vállalnám a konzulens szerepét :)

Fothy Monika 2007.12.11. 17:35:50

Akárhogy is nézem: a cseh Seznam minőségileg nagyon a Google alatt van. Nem is lehet más, hiszen ha belegondolsz, hogy sokszor hónapokig tart még hajlandó az oldalt a robot elvinni, nem bír frissíteni - milyen találatokat kaphatsz? Fejlesztenek a fiúk folyamatosan, de egyre inkább húzza őket az ár. Sajnálom is őket már, nehéz dolguk van. Más a Google és más a Yandex is: pl. több időzónán szétoszlik az erőforrás terhelés, Seznamnak még mondjuk X-szer annyi erőforrás kéne mint ami van, persze csak bizonyos órákra, vagy pl. csehországban óriási IT szakember hiány van, húsz programozóval nehéz egy piacvezető keresőt + rengeteg plusz szolgáltatást minőségileg üzemeltetni.
Ez mind meg van értve, tudjuk hogy megtesznek mindent. De sajnos nem tudnak lépést tartani, és még egy darabig örülhetnek a piacvezető pozíciónak, ami inkább csak annak köszönhető hogy a csehek ezt szokták meg. Törvényszerű, hogy az, aki naprakészen képes frissíteni és releváns találatokat mutat előbb-utóbb átveszi a vezető pozíciót. Mert jobb a felhasználóknak.

Kalmi · http://www.etarget.hu 2007.12.11. 21:35:38

A stabilitast nem tudom megitelni, menrt nem hasznalom gyakran ezt a keresot, viszont eddig mindig megtalaltam azt, amit kerestem. Szerintem is cegkereso az, amiben nagyon erosek. Talan azert is, mert ezt "emberek" is ellenorzik. A szponzoralt ajanlatokkal nekem nincs gondom, hisz relevans talalatokrol van szo.

Monika Fothy 2007.12.12. 16:07:48

Kálmi, tényleg keveset használhatod a seznamot, vagy csak szerencséd volt eddig .-) Mutatok gyorsan két példát:
1. Keresek 1 gumin lógó papagájt:
search.seznam.cz/?q=papou%C5%A1ek+na+gum%C4%9B&mod=f
egyetlen releváns szponzorált ajánlat nincs...
Ez a példa csak arról szól hogy vannak bizony oldalak ahol egyetlen releváns reklámot sem találok, bár ez inkább a sklik ügyfeleiről mutat egy képet.

De:
keresek egy vaskígyót, mert ilyet szeretnék a lakásomba:
search.seznam.cz/?q=had+kovov%C3%BD&mod=f
Ez példa viszont már a seznamról szól. Hol itt a relevancia? Saját szolgáltatását reklámozza fent - az Árukeresőjét, és abból mutat találatokat. Vaskígyó keresőszóra három digitális fényképezőgépet ajánlott. Ha pedig rákattintasz a további találatokra az árukeresőn:

zbozi.cz/searchScreen?q=had%20kovov%C3%BD&r=hint

sehol sem látok egyetlen releváns találatot. Csak megjegyzés: a sklik ugynúgy mint az előző példában, csak ireleváns találatokat mutat.

Csehül nem tudó olvasóknak megjegyzés: A vaskígyó és a digitális fényképezőgép szavak nem hasonlóak, még véletlenül sem (Had kovový - Digitální fotoaparát)

Cégkereső: igen, erősek benne, és jó is, hasznos is. Ami engem zavar a cégkeresőben az az, hogy csakis kizárólag cseh cégjegyzék számmal tudsz bekerülni. Hiába üzemeltetsz cseh portált cseh embereknek csehül - nem kerülhetsz be, mert a céged nincs bejegyezve Csehországban.

Monika Fothy 2007.12.12. 17:20:30

Előző hozzászólásomban egy képet mutattam a sklik felhasználóiról - egy releváns reklám sem volt a találati oldalon.
Véletlenül, Python Regius-ra keresve találtam most ezt:
search.seznam.cz/?q=python+regius&mod=f

Sklik reklámok, második pozíció:

Seznamte se s novou prací
Buď programátorem v Seznamu.cz!
PHP, C++, JavaScript a mnohé další. Vyvojari.Seznam.cz

Fordítás:
Ismerkedjen meg az új munkával
Legyél programozó a seznam.cz-ben!
PHP, C++, JavaScript és sok más.
Fejlesztok.Seznam.cz

Nem írtam el, első mondat magázva, második tegezve, és tényleg releváns is... egyenesen a műhelyből :-)

Kalmi · http://www.etarget.hu 2007.12.13. 09:58:54

Na jo meggyoztel :-)
Bar azert talalhato relevans hirdetes is szep szammal, pl search.seznam.cz/?q=kosmetika&mod=f