HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Kereső tanfolyam - 1. Keresőtörténelem

2010.09.13. 14:00 Szerző: siklosib Címkék: internetes keresés keresők története kereséselmélet kereső tanfolyam

Olyan sorozat megjelentetésébe kezdünk, amelynek eredetije egy informatikus könyvtárosok számára készült jegyzet. Mivel ma már nemcsak az információkereséssel hivatásszerűen foglalkozók számára fontos a keresőrendszerek ismerete, ezért úgy gondoljuk, hogy hasznos szélesebb körben is közzétenni ezt a tananyagot. Az egyes részek a keresők történetével, működésével, fajtáival és használatával foglalkoznak. Az összeállítást Drótos László, a Magyar Elektronikus Könyvtár egyik alapítója készítette.

1. Keresőtörténelem

Az első kereső: Archie

Az internet elterjedése előtti hálózatokon (pl. Minitel, Nedix, X.25, EARN/Bitnet) is voltak már kereshető szolgáltatások és ezek egy része (pl. Dialog, DataStar, STN, OPAC-ok), később az interneten is elérhetővé vált (előbb telnet, majd webes kapcsolat formájában), de ezek kívül esnek a jelen áttekintésen. Az első valóban internetes keresőszolgáltatás az Archie volt, melyet egy Alan Emtage nevű montreali diák és két társa hozott létre 1990-ben. Ez a program a nyilvános FTP archívumok (fájl- és szoftvergyűjtemények) directory-listáit gyűjtötte be és tette kereshetővé - a Unix grep parancsát felhasználva - a fájl- és alkönyvtár-neveket (az állományok tartalmában nem lehetett keresni vele!). A szolgáltatást saját klienssel, vagy valamelyik Archie-szerverhez való telnet kapcsolódással, vagy e-mailben küldött parancsokkal, vagy később már web-felületen át is lehetett használni.

A Gopher és keresői

Az 1991-ben a University of Minnesota-n kitalált gopher szolgáltatáshoz (mely hierarchikus menükön keresztül vezette el a felhasználót szöveg- vagy képfájlokhoz, ill. adatbázisokhoz) kétféle kereső is született: A Jughead (1993) egy adott gopher-szerver tartalmát tette kereshetővé, míg a Veronica (1992) az ismert szerverek mindegyikét - néhány év múlva már több ezret - végigkereste. Ezekkel is csak a menüpontok nevében lehetett keresni, a szöveg-fájlok tartalmában nem.

 

 

 

 

 

 

 

 

 

 

Wide Area Information Servers

A Thinking Machines által, a 80-as évek végén kifejlesztett, és 1991-ben szabad szoftverré tett WAIS (Wide Area Information Servers) az eredetileg online könyvtári katalógusok lekérdezésére kitalált Z39.50 nevű protokollt használta arra, hogy teljes szövegű forrásokat (pl. receptgyűjtemények, dalszövegek, könyvismertetők, bírósági határozatok, telefonkönyvek) lehessen kliens-szerver módon lekérdezni. Fénykorában, a kilencvenes évek közepén félezernél is több WAIS szerver működött a világon.

 

 

 

 

 

 

 

 

 

A World Wide Web kereshetővé tétele

Az első próbálkozások 1993 nyarán indultak. Az egyik skóciai egyetemen kifejlesztett JumpStation volt az első olyan rendszer, amely a mai keresőgépekhez hasonlóan egy robottal begyűjtötte, majd leindexelte és egy web-felületen át kereshetővé tette a WWW-szerverek tartalmát. Az indexelés 1993 decemberében indult és egy év múlva már mintegy 275 ezer tételt tartalmazott, melyeket kb. 1500 szerverről gyűjtött össze. Csak a dokumentumok címét és fejlécét gyűjtötte be (a host korlátozott erőforrásai miatt), így csak ezekben lehetett keresni. A keresési algoritmus lineáris volt (tehát lassú) és a találati listában nem volt relevancia szerinti rendezés.

Teljes szövegű keresés

Az első nyilvánosan elérhető, teljes szövegű webkereső a University of Washington hallgatója: Brian Pinkerton által indított WebCrawler volt, amely 1994 áprilisában jelent meg az interneten és akkoriban 4000 szerver anyagát tartalmazta az adatbázisa. Olyan népszerű lett, hogy csúcsidőben (amikor az USA-ban nappal volt) nem is lehetett elérni. Többszöri tulajdonosváltás után jelenleg metakeresőként működik, amely a nagy keresőket kérdezi le, vagyis már nem a saját adatbázisát használja.

Lycos

Szintén 1994-ben kezdték el a Carnegie Mellon University informatikusai fejleszteni a Lycos nevű keresőt, ami az első valóban jól használható és nagy méretű webkereső volt, és sikeres üzleti vállalkozássá is vált később. Amikor 1994 nyarán megjelent, az adatbázisa 54 ezer dokumentumra terjedt ki, 1995 januárjában ez a szám 1.5 millióra nőtt, 1996 novemberében pedig a Lycos - a világ akkori legnagyobb keresőjeként - már 60 millió tételes adatbázissal büszkélkedett. Az elsők között biztosított relevancia szerint rendezést, közelségi operátorokat ill. prefixeket a keresett szavak távolságának ill. helyének pontosításához.

 

Megindul a verseny

A Lycos példáját 1994 és 1996 között egy sor hasonló vállalkozás követte, melyek mindegyike néhány további újítást vezetett be: pl. az Excite, az Infoseek, az Inktomi, a Hotbot, és az AltaVista. Végül ez utóbbi lett a legsikeresebb és évekig vezette a keresők mezőnyét. Az Altavista komoly sávszélességgel és szerverekkel rendelkezett már kezdettől fogva, elsőként vezette be a minimalista designt, a természetes nyelvű lekérdezés lehetőségét, a részletes kereső opciókat, sőt még automatikus fordítóprogramot is biztosított Babelfish néven.

Megjelenik a Google

A keresőrendszerek piacán nagy harc indult a kilencvenes évek második felétől: a cégek felvásárolták egymást, portálokká alakultak, új szolgáltatásokkal és funkciókkal kísérleteztek, majd sokan tönkrementek az ezredforduló után a "dot.com lufi" kipukkanásakor. Ekkor tört be erre a területre a Larry Page and Sergey Brin (a kaliforniai Stanford University két Ph.D. hallgatója) által 1996-1998 közt kifejlesztett Google kereső, amely néhány év alatt a legnépszerűbb keresőgép lett a weben, messze megelőzve az elődjeit és a későbbi versenytársait is. A Google népszerűsége a gyorsasága és egyszerűsége mellett a PageRank technológiában van, aminek eredményeként nagyon releváns találatokat ad.

 

 

 

 

 

 

 

 

 

Bing és Yahoo

A Microsoft cég 1998-ban jelent meg keresőszolgáltatással a weben előbb MSN Search majd Live Search néven, de kezdetben nem saját technológiát használt, hanem más keresőgépeket kérdezett le, és csak 2004 végén jelent meg a saját rendszerével. A szolgáltatást 2009 júniusában Bing-re keresztelték át, és komoly reklámkampányba kezdtek, hogy minél nagyobb piaci részesedére tegyenek szert ezen a területen is. Hasonló utat járt be a Yahoo! Search is: az eredetileg webes címtárként híressé vált Yahoo! sokáig más keresőket épített be a portáljába, és csak 2004-től indított saját rendszert. 2009 nyarán viszont bejelentették, hogy a Bing-et használják a továbbiakban.

 

Magyar keresők

A korai magyar fejlesztések közül meg kell említeni a Hungary Network által 1995-ben indított (és 2005-ben felújított) Heuréka keresőt; az 1999-ben megjelent Góliát-ot (ezt használta az Index és a Startlap is), és a Matáv által 1998 májusában létrehozott Altavizsla nevű oldalt, amely később Vizsla névre hallgatott, jelenleg pedig Ok.hu-nak hívják és az Origó portál része, de ez valójában különböző külföldi keresőmotorokat (kezdetben az AltaVista, később a Northern Light és a Yahoo által megvett Overture, 2007-től pedig a Google) használ(t) a magyar web lekérdezésére. 2010 elején három új hazai kereső is megjelent: a speciális keresőfunkciókban gazdag Bluu, a találatok rendezésében és megjelenítésében újszerű Szörcs, valamint a tartalomjegyzéket kínáló Johu kereső.

Írta: Drótos László, Magyar Elektronikus könyvtár

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr312292221

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

süti beállítások módosítása