Keressünk együtt 2 - Építsünk keresőt

2007.09.19. 21:44 Szerző: Kereso75 Címkék: wikia kollaboratív keresés grub

Van egy másik igéretesnek látszó kezdeményezés a területen a Grub.org, ami egy elosztott crawler. Ha valaki feltelepíti a Grub programját a gépre, akkor az ő gépéről is futni fog egy program ami a web egy részét bejárja és az eredményeket feltölti a Grub adatbázisába. Annyiban más a megközelítés mint a korábban említett esetben, hogy itt központi index épül. Sokáig haldokolni látszott a Grub, míg az idén nyáron felkarolta a Wikia, akik a nyílt keresőjük részeként építenek a Grub projektre.

Négy alapelvet fogalmaznak meg arról milyennek is kell lennie a jövő internetes keresőjének:

1. Átlátható - Lehessen tudni, hogyan működik a rendszer, milyen algoritmusokra épül. Nyílt forráskód, nyílt tartalom.
2. Közösség - Mindenki hozzájárulhat valamivel
3. Minőség - Jelentősen javítani találatok pontosságát és jobbá tenni a keresési élményt
4. Adatvédelem - Ne tároljunk semmilyen személyes, azonosítható adatot

Jogos felvetések, amelyek közül én elsősorban az elsőt tartom nagyon lényegesnek. Ki tudhatja valójában, hogy egy-egy találat miért pont oda rangsorolódik valamelyik üzleti keresőben? A keresők nagyon is fekete dobozként működnek. Persze ezzel lehet vitatkozni is, hiszen ha tudom a pontos rangsor képzési eljárást, akkor elvileg könnyebben előre is tudom juttatni a saját oldalamat.

Mindenesetre aki rögtön a tettek mezejére akar lépni, javaslom töltse is le a Grub crawlert és futtassa a gépén. Elég jól beállítható, hogy mennyi erőforrást (processzor és sávszélesség) engedünk használni. Ha letöltötted és futtatni akarod csatlakozz a Hungary csoporthoz. Egy tagja már van. :o)

A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Facebook Tweet

4 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr7170792

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

mosquito · http://www.seoblog.hu 2007.09.20. 10:10:48

en hajlok abba az iranyba, h jobb ez igy, h fekete dobozkent mukodnek. meg igy is lehet oket manipulalni kicsit, hat meg akkor mi lenne ha full publikusak lennenek az algoritmusok. szeretnek hinni abban, h tudna mukodni, de naiv nem vagyok, ez egy szemet vilag, a marketing pedig nem az etikussagarol hires szakma, es gyanitom, h ennel meg csak rosszabb lesz a helyzet.

Válasz erre

Kereso75 · http://kereses.blog.hu 2007.09.20. 12:59:14

Valóban lehetnek hátrányai is a nyílt megoldásnak, ahogy már én is jeleztem a cikkben, de hosszútávon biztos, hogy nem szül jót, ha valami kvázi monopóliumként működik. Az információk elérésének szabadsága korlátozható vele például. Gondolj csak a Google kínai esetére, amikor bizonyos oldalak megjelenését letiltották az indexükből, mondván arra egy kínai a cenzúra miatt úgy sem tud majd kattintani.

Válasz erre

AlBrown · http://www.netkezdo.hu 2007.09.20. 13:05:17

Már 2 tagja van a Hugary csoportnak. :)
A kezdeményezés nagyon tetszik, de még rettentően gyerekcipősnek tűnik a dolog. A kliens szépen muzsikál, de a webes felületük, még igen kezdetleges. Most pl MySql hibákat dobál egyfolytában, keresni éppen nem lehet. Kiváncsi vagyok mi fog kisülni ebből, én drukkolok.

Egészen addig, amig nem 100% ban hibátlan egy népszerű kereső addig, jobb ha fekete dobozként működik :) Ha létezne a "tökéletes" algoritmus, azt akkor sem lehetne manipulálni ha ismerük a működését. Valószínűleg ilyen sosem lesz :)

Válasz erre

aziro 2007.09.21. 23:25:52

Csatlakoztam én is a csapathoz, a szabad kapacitását a gépeimnek feláldozom. Lássuk mi sül ki belőle.

Válasz erre

HTML

Precognox

Precognox Blogkereső

opendata.hu

Facebook oldaldoboz

Blog figyelése (RSS)

Érdekes oldalak

Star Wars text mining

Főbb témák

Archívum

Belépés

A blog tartalmai CC licenc alá tartoznak

Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox

Keressünk együtt 2 - Építsünk keresőt

2007.09.19. 21:44 Szerző: Kereso75 Címkék: wikia kollaboratív keresés grub

4 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

Kommentek:

mosquito · http://www.seoblog.hu 2007.09.20. 10:10:48

Kereso75 · http://kereses.blog.hu 2007.09.20. 12:59:14

AlBrown · http://www.netkezdo.hu 2007.09.20. 13:05:17

aziro 2007.09.21. 23:25:52

HTML

Precognox

Precognox Blogkereső

opendata.hu

Facebook oldaldoboz

Blog figyelése (RSS)

Érdekes oldalak

Star Wars text mining

Főbb témák

Archívum

Belépés

A blog tartalmai CC licenc alá tartoznak

Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox

Keressünk együtt 2 - Építsünk keresőt

2007.09.19. 21:44 Szerző: Kereso75 Címkék: wikia kollaboratív keresés grub

4 komment • Kövess Facebookon • Iratkozz fel értesítőre

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek:

mosquito · http://www.seoblog.hu 2007.09.20. 10:10:48

Kereso75 · http://kereses.blog.hu 2007.09.20. 12:59:14

AlBrown · http://www.netkezdo.hu 2007.09.20. 13:05:17

aziro 2007.09.21. 23:25:52