HTML

Kereső Világ

Ha érdekel a keresés, a különféle keresők lelkivilága, előnyei hátrányai. Mert több a keresés, mint csupán guglizni, avagy "élet a Google-n túl".
2002 óta foglalkozom különféle keresők fejlesztésével.

Jóföldi Endre

Személyes blogom

Blog figyelése (RSS)

FeedBurner RSS statisztika

 Add hozzá az RSS olvasódhoz (Mi az RSS?)

Ha levélben szeretnél értesülni az új cikkekről:

Ha tetszik a blog, mentsd el a címét: AddThis Social Bookmark Button

Kövess a twitteren

Várószoba közösségi oldal

Olvasom:

Utolsó kommentek

Elindult az iGlue szemantikus kereső

Szerző: siklosib Címkék: szemantikus keresés iglue

2009.11.12. 14:33

Megosztás

Elindult a magyar fejlesztésű iGlue tartalomszervező és kereső eszköz ingyenesen hozzáférhető verziója.

A szöveges tartalomban való keresés hagyományos megoldása a keresett kifejezést reprezentáló karaktersorozat felismerése. Ezzel szemben az iGlue nem szóalakokat azonosít, hanem azok jelentését. Így a keresett információt akkor is megtalálhatjuk, ha nem ugyanabban a formában szerepel.

Az iGlue keresője tehát egy ilyen alapokon megvalósított adatbázis, részletes keresési opciókkal. A tárolt információk között kereshetünk általánosan, melynek eredményeit kategóriákba rendezve kapjuk, vagy már kiindulásként szűkíthetjük a keresés hatókörét a számunkra érdekes kategóriára. A nagy részletességgel kidolgozott adatbázisnak köszönhetően egy-egy kategória tulajdonsága alapján is kereshetünk, kiválasztva akár, hogy az 1950-ben született, később Kossuth-díjjal kitüntetett személyeket, illetve hozzájuk kapcsolódó információkat szeretnénk megtalálni.

A szemantikai adatbázis jelenleg több mint 20 millió adatbejegyzést tartalmaz különböző formátumban tárolva, legyen az kép, video, személy, intézmény, weboldal, földrajzi hely, vagy bármilyen objektum, melyek között természetesen megjelennek a szemantikai kapcsolatok is. Az adatbázis egyelőre zárt, de hamarosan megnyílik, így mind emberi mind mesterséges intelligencia alkalmazásával, a weboldalakon található entitások és a közöttük lévő szemantikai kapcsolatok automatikus azonosításával folyamatosan bővülni fog, kiterjesztve a jelenlegi hiányos lefedettséget.

Ha nézegeted, feltétlenül vedd figyelembe:

A keresés az adatbázisban található entitásokra terjed ki (személyek, földrajzi helyek, intézmények, képek stb.).

3 komment • Oszd meg másokkal • Iratkozz fel értesítőre

Keresőmarketing nap - ismét

Szerző: kereso Címkék: keresőmarketing marketing

2009.11.09. 17:59

Megosztás

Ismét megrendezésre kerül, november 18-án a Keresőmarketing nap. Személyesen is érdekelt leszek egy kerekasztalban, így különösen lelkesen ajánlom.  Idézet a nap oldaláról:

"Tudta-e, hogy a keresőmarketing egyike azon kevés eszköznek a reklámpiacon, mely a válságban is növekszik? Meg szeretné tudni, hogy mi várható jövőre? Találkozni szeretne a hazai SEO gurukkal? Egy szakmai nap arról a reklám- és marketingeszközről, amely manapság a legtöbbet foglalkoztatja a marketingeseket, vállalkozókat, kereskedőket és reklámszakembereket. Egy nyitott beszélgetés, ahol mindenki megkapja kérdéseire a választ.
Egy nap, hogy rövid legyen és velős."

Bővebbet a rendezvény lapján.

Szólj hozzá! • Oszd meg másokkal • Iratkozz fel értesítőre

Közösségi keresést jelentett be a Google

Szerző: kereso Címkék: közösségi keresés

2009.10.26. 21:10

Megosztás

Marissa Mayer beszél a Google új közösségi keresési funkcióiról, amely előbb a Labs-ben aztán egyes kiválasztott userek számára lesz elérhető.

2 komment • Oszd meg másokkal • Iratkozz fel értesítőre

Hatékony keresés honlapokon

Szerző: kereso Címkék: keresés saját lapon keresési felület

2009.10.22. 17:31

Megosztás

"A weben egyre fontosabb a hatékony keresés. Különösen igaz ez az olyan oldalakra, ahol sok termék vagy információ található. A legtöbb oldal tervezői már felismerték, hogy keresésre szükség van, de a keresésben használt eszközök nehézkesek, a találatok jellege, bemutatása és sorrendje sokszor esetleges. Ha alkalmazzuk a következőkben bemutatásra kerülő megközelítéseket, akkor keresésünk hatékony és valóban felhasználó-központú lesz..."

Olvasd tovább a teljes cikket Rung András blogján az Ergománián.

Szólj hozzá! • Oszd meg másokkal • Iratkozz fel értesítőre

Szemantikus ki-mit-tud?

Szerző: siklosib Címkék: szemantikus keresők

2009.10.21. 12:41

Megosztás

Megjelent egy cikk a BMC Bioinformatics folyóiratban, melyben a szerzők részletesen összehasonlítják a működő szemantikus keresőket. Talán a címmel ellentétben nem igazán "Ki mit tud?" jelleggel, mert nem a végső produkció értékeléséről van szó, hanem inkább egy összefoglalás arról, hogy milyen utakon lehet eljutni bármiféle szemantikai kereső alkalmazás megvalósításához.

Különböző szempontok szerint lehet csoportosítani az ilyen keresőket.

A felhasznált adattípus alapján

  • RDF-OWL alapú keresők: A legélesebb választóvonal a bemeneti adattípus alapján húzható. A szemantikus web technológiáit felhasználva vannak keresők, melyek előre feldolgozott, szemantikai információval bővített adathalmaz alapján működnek, mint például a Swoogle, a Semantic Web Search Engine (SWSE), a WikiDB, a Sindice, a Watson, a Falcon és a Corese. Ezek bemeneti formátuma nem sima szöveges dokumentum, hanem RDF adatmodellt használnak, illetve OWL fájlokat keresnek. Mivel az így előfeldolgozott oldalak száma elég kevés, előállításuk nehézkes, ezért ezek a keresők erősen limitáltak.
  • Szöveg alapú keresők: A keresők másik nagy csoportja sima szöveges dokumentumokban keres, ami lehetővé teszi a sokkal tágabb körű feldolgozást. Erre a csoportra nem csak a feldolgozható információhalmaz bővebb rendelkezésre állása a jellemző, hanem a technológiai szabadság is. Nem egy előre meghatározott keret alapján valósítják meg a szemantikai keresést, hanem különböző irányokból megközelítve. Így több szempont alapján lehet ezeket a rendszereket jellemezni: a feldolgozott dokumentumok témája (web, orvosi, wiki, stb), háttértudás, ontológia használata, különböző szövegfeldolgozási eljárások használata alapján.

Általános keresők, akik mindent tudnak

A PolyMeta, a Hakia, a START, az Ask.com, a BrainBoost, az AnswerBus, a Cuil, a Clusty, és a Carrot általános keresőként működnek, a weben előforduló minden témájú és tartalmú szöveg keresésével. Így nem csak milliós, de milliárdos nagyságrendű dokumentum feldolgozásával. Mivel háttér ontológiát nem használnak, a pusztán kulcsszó alapú keresést nyelvfeldogozási algoritmusok alkalmazásával egészítik ki: szótövesítés, kifejezéscsoportok azonosítása, mély/felszíni elemzés, stb.

Eredmények megjelenítése

A Polymeta, a Cuil, a Clusty, és a Carrot keresők a rengeteg eredmény között való eligazodás elősegítésére azokat csoportosítva jelenítik meg. A klaszterek elnevezése azonban nem valamilyen ontológia vagy tezaurusz alapján meghatározott összefoglaló név, hanem a találatokban szereplő közös kifejezés. Így mivel a tartalmi jelentést csupán a dokumentumokban valójában előforduló nyelvi jelenségek alapján, illetve azok feldolgozása során értelmezik, nem igazán nevezhetőek szemantikus keresőknek. Ezzel azonban megtartják azt az előnyüket, hogy teljesen általánosan alkalmazhatóak, hiszen nem függenek semmilyen háttértudástól.

Úton az ontológia felé...

A szemantikai térképen újabb terület képviselői a PowerSet és a QuAlim. Ezek a rendszerek a wikipedia hatalmas, és egyre növekvő tudását használják fel különböző feldolgozási módszerek segítségével. Valódi ontológiát tehát ezek sem tartalmaznak, de ilyen formán a keresett dokumentumok jelentéséről többet tudnak a wikipediából kinyert információk segítségével.

A hagyományos kulcsszó alapú és a szakterületi ontológiát alkalmaz keresők között található a GoWeb, mely mindkét módszert kihasználva általánosan keres, majd ontológiai szűrést és csoportosítást valósít meg.

Vertikális keresők

A következő nagy kategóriába tartoznak a vertikális keresők, jelen példában az orvosi-egészségügyi téren. Míg az eddigi rendszerek előnye volt az általános alkalmazhatóság, hiányosságuk a speciális szakterületeken való járatlanságuk. A szakterületi keresők azonban alkalmasak arra, hogy a különböző forrásokból származó háttértudás alapján képesek legyenek mélyebb szemantikai kapcsolatok felfedésére is, így a valóban releváns eredményeket nagyobb eséllyel találják meg. A HealthMash, a GoPubMed és az EBIMed például a GeneOntology és a Medical Subject Headings (MeSH) tudását használják ki; az XPlorMed nyolc MeSH kategória alapján szűri meg az eredményeket; az IHOP a gének és fehérjék megnevezéseit használja ki, mint  mondatok közötti kapcsolatot. Az EAGli és az askMedline pedig a bemenetként kapott valódi kérdésekre keresi a választ.

A valódi ontológiát alkalmazó rendszerek esetén az eredmények jellege lehetővé teszi, hogy a megjelenített klaszterek alapja is ez a háttértudás legyen, az ebben szereplő összefüggések és hierarchikus kapcsolatok alapján.

Szólj hozzá! • Oszd meg másokkal • Iratkozz fel értesítőre