Olyan sorozat megjelentetésébe kezdünk, amelynek eredetije egy informatikus könyvtárosok számára készült jegyzet. Mivel ma már nemcsak az információkereséssel hivatásszerűen foglalkozók számára fontos a keresőrendszerek ismerete, ezért úgy gondoljuk, hogy hasznos szélesebb körben is közzétenni ezt a tananyagot. Az egyes részek a keresők történetével, működésével, fajtáival és használatával foglalkoznak. Az összeállítást Drótos László, a Magyar Elektronikus Könyvtár egyik alapítója készítette.
1. Keresőtörténelem
Az első kereső: Archie
Az internet elterjedése előtti hálózatokon (pl. Minitel, Nedix, X.25, EARN/Bitnet) is voltak már kereshető szolgáltatások és ezek egy része (pl. Dialog, DataStar, STN, OPAC-ok), később az interneten is elérhetővé vált (előbb telnet, majd webes kapcsolat formájában), de ezek kívül esnek a jelen áttekintésen. Az első valóban internetes keresőszolgáltatás az Archie volt, melyet egy Alan Emtage nevű montreali diák és két társa hozott létre 1990-ben. Ez a program a nyilvános FTP archívumok (fájl- és szoftvergyűjtemények) directory-listáit gyűjtötte be és tette kereshetővé - a Unix grep parancsát felhasználva - a fájl- és alkönyvtár-neveket (az állományok tartalmában nem lehetett keresni vele!). A szolgáltatást saját klienssel, vagy valamelyik Archie-szerverhez való telnet kapcsolódással, vagy e-mailben küldött parancsokkal, vagy később már web-felületen át is lehetett használni.
A Gopher és keresői
Az 1991-ben a University of Minnesota-n kitalált gopher szolgáltatáshoz (mely hierarchikus menükön keresztül vezette el a felhasználót szöveg- vagy képfájlokhoz, ill. adatbázisokhoz) kétféle kereső is született: A Jughead (1993) egy adott gopher-szerver tartalmát tette kereshetővé, míg a Veronica (1992) az ismert szerverek mindegyikét - néhány év múlva már több ezret - végigkereste. Ezekkel is csak a menüpontok nevében lehetett keresni, a szöveg-fájlok tartalmában nem.
Wide Area Information Servers
A Thinking Machines által, a 80-as évek végén kifejlesztett, és 1991-ben szabad szoftverré tett WAIS (Wide Area Information Servers) az eredetileg online könyvtári katalógusok lekérdezésére kitalált Z39.50 nevű protokollt használta arra, hogy teljes szövegű forrásokat (pl. receptgyűjtemények, dalszövegek, könyvismertetők, bírósági határozatok, telefonkönyvek) lehessen kliens-szerver módon lekérdezni. Fénykorában, a kilencvenes évek közepén félezernél is több WAIS szerver működött a világon.
A World Wide Web kereshetővé tétele
Az első próbálkozások 1993 nyarán indultak. Az egyik skóciai egyetemen kifejlesztett JumpStation volt az első olyan rendszer, amely a mai keresőgépekhez hasonlóan egy robottal begyűjtötte, majd leindexelte és egy web-felületen át kereshetővé tette a WWW-szerverek tartalmát. Az indexelés 1993 decemberében indult és egy év múlva már mintegy 275 ezer tételt tartalmazott, melyeket kb. 1500 szerverről gyűjtött össze. Csak a dokumentumok címét és fejlécét gyűjtötte be (a host korlátozott erőforrásai miatt), így csak ezekben lehetett keresni. A keresési algoritmus lineáris volt (tehát lassú) és a találati listában nem volt relevancia szerinti rendezés.
Teljes szövegű keresés
Az első nyilvánosan elérhető, teljes szövegű webkereső a University of Washington hallgatója: Brian Pinkerton által indított WebCrawler volt, amely 1994 áprilisában jelent meg az interneten és akkoriban 4000 szerver anyagát tartalmazta az adatbázisa. Olyan népszerű lett, hogy csúcsidőben (amikor az USA-ban nappal volt) nem is lehetett elérni. Többszöri tulajdonosváltás után jelenleg metakeresőként működik, amely a nagy keresőket kérdezi le, vagyis már nem a saját adatbázisát használja.
Lycos
Szintén 1994-ben kezdték el a Carnegie Mellon University informatikusai fejleszteni a Lycos nevű keresőt, ami az első valóban jól használható és nagy méretű webkereső volt, és sikeres üzleti vállalkozássá is vált később. Amikor 1994 nyarán megjelent, az adatbázisa 54 ezer dokumentumra terjedt ki, 1995 januárjában ez a szám 1.5 millióra nőtt, 1996 novemberében pedig a Lycos - a világ akkori legnagyobb keresőjeként - már 60 millió tételes adatbázissal büszkélkedett. Az elsők között biztosított relevancia szerint rendezést, közelségi operátorokat ill. prefixeket a keresett szavak távolságának ill. helyének pontosításához.
Megindul a verseny
A Lycos példáját 1994 és 1996 között egy sor hasonló vállalkozás követte, melyek mindegyike néhány további újítást vezetett be: pl. az Excite, az Infoseek, az Inktomi, a Hotbot, és az AltaVista. Végül ez utóbbi lett a legsikeresebb és évekig vezette a keresők mezőnyét. Az Altavista komoly sávszélességgel és szerverekkel rendelkezett már kezdettől fogva, elsőként vezette be a minimalista designt, a természetes nyelvű lekérdezés lehetőségét, a részletes kereső opciókat, sőt még automatikus fordítóprogramot is biztosított Babelfish néven.
Megjelenik a Google
A keresőrendszerek piacán nagy harc indult a kilencvenes évek második felétől: a cégek felvásárolták egymást, portálokká alakultak, új szolgáltatásokkal és funkciókkal kísérleteztek, majd sokan tönkrementek az ezredforduló után a "dot.com lufi" kipukkanásakor. Ekkor tört be erre a területre a Larry Page and Sergey Brin (a kaliforniai Stanford University két Ph.D. hallgatója) által 1996-1998 közt kifejlesztett Google kereső, amely néhány év alatt a legnépszerűbb keresőgép lett a weben, messze megelőzve az elődjeit és a későbbi versenytársait is. A Google népszerűsége a gyorsasága és egyszerűsége mellett a PageRank technológiában van, aminek eredményeként nagyon releváns találatokat ad.
Bing és Yahoo
A Microsoft cég 1998-ban jelent meg keresőszolgáltatással a weben előbb MSN Search majd Live Search néven, de kezdetben nem saját technológiát használt, hanem más keresőgépeket kérdezett le, és csak 2004 végén jelent meg a saját rendszerével. A szolgáltatást 2009 júniusában Bing-re keresztelték át, és komoly reklámkampányba kezdtek, hogy minél nagyobb piaci részesedére tegyenek szert ezen a területen is. Hasonló utat járt be a Yahoo! Search is: az eredetileg webes címtárként híressé vált Yahoo! sokáig más keresőket épített be a portáljába, és csak 2004-től indított saját rendszert. 2009 nyarán viszont bejelentették, hogy a Bing-et használják a továbbiakban.
Magyar keresők
A korai magyar fejlesztések közül meg kell említeni a Hungary Network által 1995-ben indított (és 2005-ben felújított) Heuréka keresőt; az 1999-ben megjelent Góliát-ot (ezt használta az Index és a Startlap is), és a Matáv által 1998 májusában létrehozott Altavizsla nevű oldalt, amely később Vizsla névre hallgatott, jelenleg pedig Ok.hu-nak hívják és az Origó portál része, de ez valójában különböző külföldi keresőmotorokat (kezdetben az AltaVista, később a Northern Light és a Yahoo által megvett Overture, 2007-től pedig a Google) használ(t) a magyar web lekérdezésére. 2010 elején három új hazai kereső is megjelent: a speciális keresőfunkciókban gazdag Bluu, a találatok rendezésében és megjelenítésében újszerű Szörcs, valamint a tartalomjegyzéket kínáló Johu kereső.
Írta: Drótos László, Magyar Elektronikus könyvtár