Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox
Szemét a keresőkben
2007.10.02. 23:09 Szerző: google spam keresőszemét
Címkék:A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Újdonságok a Yahoo keresőben
2007.10.02. 21:07 Szerző: yahoo kereső szándéka
Címkék:Tegnap több területen jelentős fejlesztések kerültek bejelentésre a Yahoo keresőben. Most is úgy jártunk, mint a Live-nál, hogy Magyarországon nem minden elérhető, mindenesetre bemutatni akkor is érdemes őket, hiszen jelzik milyen irányban tapogatóznak a keresés nagyjai.
Talán nem mindenki tudja, hogy 2000-től 2003-ig a Google adta a keresési találatok a Yahoo részére, amikor is újra önálló útra léptek - nem mellékesen mert megerősödött a technológia hátterük több kisebb kereső felvásárlásával (Inktomi, Altavista, Alltheweb). A mostani újdonságok egy részének alapját pedig az azóta vásárolt szolgáltatások (flickr, upcoming stb), illetve új fejlesztéseik Yahoo Answers és Video jelentették.
Két területre oszthatók a fejlesztések: hatékonyabb keresőkifejezés megtalálásának segítése, illetve sokrétű a kereső feltétlezett szándékát jobban visszaadó találatmegjelenítés.
Yahoo Search Assist
Arra a problémára próbálnak megoldást adni, hogy sokszor mi magunk sem tudjuk, hogy lehetne a legjobban a keresési kérdést megfogalmazni. A keresőkifejezés begépelése közben folyamatosan változó javaslatokat láthatunk arra, mit is kereshetnénk. Magyarul ez egyelőre az általunk addig begépelt szóval kezdődő kifejezéseket jelent, míg angolul más kapcsolódó kifejezéseket is láthatunk.
Sajnos az ékezetes karakterek is megakasztják a működését, úgy hogy magyarul nem annyira hasznos a szolgáltatás mint angolul.
Videók és képek a találatok között
A Google Universal Search megoldásához hasonlóan a szöveges találatok közé képek, illetve videók is kerülhetnek, amelyeket ott helyben le is lehet játszani. A képekre hirtelen nem találtam magyar nyelvű példát:
Videót egyelőre a Yahoo Video, a Youtube és a Metacafé adatbázisából hoznak, de szeretnék bővíteni a forrásokat. Videót például az "ákos" szóra keresve láthatunk:
És a többi: programok, éttermek
Sajnos ezeket itthonról nem tudjuk használni, mindenesetre hasznos szolgáltatásoknak tűnnek. Az első példában San Francisco-ban keresünk programokat, a másodikban ugyanott sushi éttermeket.
Érdemes használni a Yahoo-t?
Mindenképpen érdemes ezt is használni, ahogy más keresőket is a Google-n kívül. Ne gondold, hogy azért mert a Google találata elég jó, és a célodnak valamennyire megfelel, nem létezhet annál jobb találat is az adott keresőkifejezsére. Az egyik célom a Kereső Világgal éppen az, hogy bemutassam keresni valóban több mint csupán "to google", ahogy az angol mondja.
Az újdonságok bővebb leírása: a Search Engine Journal cikkében
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
7 komment • Kövess Facebookon • Iratkozz fel értesítőre
Mit tehetünk a szemét ellen?
2007.10.02. 05:38 Szerző: spam keresőoptimalizálás metakereső rankelés meta kereső
Címkék:Berényi Konrád ír az online marketing szemetéről, ami bennem is elindított néhány gondolatot.
Személyesen hasonló a dilemmám a keresőoptimalizálással kapcsolatban. Az optimalizálás akkor hasznos a keresők szempontjából, ha az oldal valódi tartalma van kiemelve, és nem csak az cél, hogy néhány gyakran keresett kulcsszóra mesterségesen felpumpált helyezéseket érjenek el oldalak. A legtöbb optimalizálási technika egyébként olyan, amit minden egyes honlap létrehozásakor figyelembe kellene venni. Analógiával élve hasonló ez, mint a törésteszt az autóiparban. Ma már nem elegendő versenyelőnynek, ha egy autónak jó töréstesztje van, szinte mindegyiknek az van (persze mert ráoptimalizálták az autókat a töréstesztre), viszont egyértelműen ellehetetlenítő tényező a fejlettebb piacokon a rossz törésteszt eredmény. Az oldalak optimalizálása azonban ma még nem tart itt. Bizonyos esetekben a sorrend akár hirdetésnek is tekinthető: az kerül legelőlre, aki a legtöbbet fizeti. Csak éppen a pénzt nem a kulcsszavas hirdetésre költötték, hanem a keresőoptimalizálásra.
Tehát az optimalizálás akkor lesz igazán a javunkra, ha gyakorlatilag az összes oldal használni fogja, és nem fog önmagában előnyt jelenteni a keresések során.
Egyébként pontosan ezért is érzem hasznosnak a metakereső (több kereső egyidejű keresése) koncepciót erről az oldalról nézve, mert egy oldallal sokkal nehezebb bespammelni az összes keresőt, mint csak egyet, ugyanis a keresők egymástól jelentősen különböző eredményeket adnak vissza, az eltérő fontosság meghatározási stratégia miatt. Ezért, ha egy oldal több keresőben is szerepel például az első oldalon, bátrabban mondhatjuk, itt valóban jó találatról van szó.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
1 komment • Kövess Facebookon • Iratkozz fel értesítőre
Magyar keresők a dmoz-ban
2007.09.28. 12:33 Szerző: dmoz
Címkék:Örömmel jelentem, hogy a kereső kategória szerkesztőjeként várom a linkjavaslatokat, és végre elbírálásra kerültek azok is, akik akár már 2007. február óta várakoztak.
Arra is bíztatnék, hogy azon túl, hogy a kritikánkat hangoztatjuk a dmoz-zal kapcsolatban, tegyünk is valamit a minőség javulása, és a valóban hosszú reakcióidő csökkentése érdekében: jelentkezz te is szerkesztőnek!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
4 komment • Kövess Facebookon • Iratkozz fel értesítőre
A Live.com kereső újdonságai
2007.09.27. 16:17 Szerző: live
Címkék:A Microsoft Searchification eseményén tegnap bemutatták a Live kereső részben már publikus, részben a közel jövőben várható újdonságait. A Live Magyarországon nem túl elterjedt, de a háttérből adódóan mindenképpen érdemes odafigyelni rá.
Érdekes módon Amerikában, bár a keresők több mint egyharmada használja a Live keresőt, a végrehajtott keresések számában már csak 10 százalék körüli a részesedésük. Ebből követekeztettek arra - mekkora felfedezés - , hogy a felhasználók nem elégedettek az eredményekkel. Az egyharmadnyi részesedés persze nyilván köszönhető a Windowshoz, Hotmailhez kapcsolódó kereséseknek is...
A főbb újdonságok:
- jobb relevancia: sok példát mutattak rá, mindenesetre, mint aki magam is keresőt fejlesztek, tudom, hogy mindenkinek megvannak a jól bejáratott példái. Szóval ezt hagyjuk a felhasználókra, hogy tényleg így érzik-e majd.
- több vertikális jellegű alkalmazásnál jelentős fejlesztéseket csináltak: vásárlás, egészség témájú keresés. Tettem egy próbát amerikai és itthoni gépről is kipróbálva a keresőt és sajnos egyelőre ebből mi kimaradunk (illusztráció a cikk végén), de nekik biztosan nagyon jó lesz. :o)
- szintén előre lépett a helyi keresés (szintén nem látunk belőle mi semmit), és a celeb jellegű keresések vonalán
- az átnézett oldalak (indexelt) száma 5 milliárdról 20 milliárdra nőtt. Ez a gyakorlatban azt jelentheti, hogy ritkábban előforduló szavak, szókapcsolatok esetén javult az esélyünk a találatra.
Mindhárom forrás ahonnan olvastam elég pozitívan nyilatkozik, de hát ebből még lekell vonni a svédasztal faktort (biztos jóltartották őket), szóval majd meglátjuk. Mindenesetre próbáljátok ki a Live-ot ti is.
Végül az ígért kép egy amerikai ip-ről futtatva a keresőt: (a magyarországit nem vágtam be, mert ezt egyszerűen mindenki kitudja próbálni)
Ha további részletekre vagy kiváncsi a SearchEngineWatch és a Search Engine Land cikkeit ajánlom.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.