HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Search+Google+

2012.01.22. 12:03 Szerző: Zoltán Varjú Címkék: google google plus

Kádár Ákos írása

Két héttel ezelőtt (2012.01.10.) jelentette be a Google a „Search Plus Your World”-nek keresztelt, sok ellenérzést kiváltó újítását. A searchengineland a következőképpen foglalja össze az előzményeket:

2005 júniusa óta jelennek meg a Google-ben személyes keresési eredmények (personalized search result; PSR). Ez azt jelenti, hogy egyes találatok személyre jellemző viselkedés és érdeklődési kör alapján előrébb kerülnek a rangsorban. Így előfordulhat, hogy az első oldalon olyan találatok is lesznek, amik amúgy jóval később szerepelnének.

2009 októberében rukkolt elő a Google az SSR-el (social search result), vagyis a közösségi keresés eredményeivel, decemberre pedig kiterjesztették a PSR-t, bizonyos mértékig, olyan felhasználókra is akik nincsenek bejelentkezve a Google-be. Ez utóbbi hasonló az SSR-hez, személyre szabott találati listáról van szó, de itt az alapján vándorolnak a találatok a rangsorban, hogy kiket ismer a felhasználó és nem az alapján, hogy mi az érdeklődési köre.

2011 februárjában kerültek bele az SSR keresési eredmények a „szokásos” találatok közé, illetve ezentúl nem csak az ismerősök által létrehozott, de az általuk különböző közösségi hálókon (pl. Facebookon) megosztott tartalmak is bekerültek a találatokba.

Az új Google

A Search Plus Your World gyakorlatilag egyesíti a PSR-t és az SSR-t kiegészítve fotókkal, linkekkel stb., amiket a Google+ felhasználók osztanak meg egymással. Vessünk egy pillantást arra, hogy ez a gyakorlatban, hogy is néz ki a PC World cikke alapján.

Három különböző típusú Google+ tartalomról van szó: személyes találatok (personal results), profilok a keresésben (profiles in search), személyek és oldalak (people and pages).

A személyes találatokhoz tartoznak a felhasználó Google+ fotói és posztjai illetve olyan tartalmak, amiket megosztottak vele. Ezek lehet, hogy csak egy bizonyos körnek szólnak, vagy akár nem is publikusak, azonban a Google nyilatkozata szerint, csak olyan usereknek válnak láthatóvá, akik jogosultak rá. Így nem kell félni, hogy például mindenki meg tudja nézni a bulikon, nyaralásokon készült fényképeinket.

A „profilok a keresésben” két dolgot jelent. Egyrészt, ha elkezdjük gépelni, hogy „Kov” és az ismerőseink között van Kovács Andor, akkor a kis kereső konzolban megjelenik ajánlatként „Kovács Andor”. Másrészt pedig a találatok közt szerepelnek majd híres színészek, tudósok, közéleti személyiségek Google+ profiljai.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A „személyek és oldalak” gyakorlatilag Google+ business page-ekre és ismert emberek Google+ profiljaira mutató találatok listája. A Google állítása szerint, ha a felhasználó beír egy nagyon általános fogalmat, például azt hogy „zene”, akkor megjelenik mondjuk Britney Spears vagy Eminem Google+ profilja. Ez az egész egy Personal Search-nek keresztelt nézetben fog megjelenni. Jobboldalon látható az ikon, amivel aktiválni lehet ezt a fajta keresést (tehát ki is lehet kapcsolni!) illetve baloldalon látszik, hogy 50 személyes és 419,000 egyéb eredmény található a listában.

 

Kritika

2011 augusztusában a PageLever egyik tanulmánya kimutatta, hogy a Facebook külsőleg hivatkozott forgalmának a harmada a Google-től származik. A Twitter álláspontja szerint nehezebb lesz időszakos Twitter posztokat keresni Google-el, például az egyiptomi és szíriai helyzetről, így jelentős versenyelőnyre tesz szert a Google. Nem meglepő, hogy a nemzetközi sajtóban elterjedt az a hozzáállás, hogy a Search Plus Your World gyakorlatilag egy népszerűsítő kampány a Google+ mellett. Számtalan ellenséges kritika közül én Danny Sullivan álláspontját tartom a leginkább plauzibilisnek és össze is foglalom most a nonstopuzlet.hu cikke alapján.

Danny Sullivan szerint a Google+ integrálása szembe megy a relevanciával. Kiemeli, hogy a Google közösségi oldala irreálisan nagy szerepet kap a Twitterrel és Facebookkal szemben. A Facebookos és Twitteres találatok háttérbe szorulnak, így a cégek rá lesznek kényszerülve, hogy saját Google+ profilt hozzanak létre, hiszen így kerülhetnek jó helyre a találatok rangsorában. Megjegyzi, hogy a Google voltaképp egy kereső és sérül a fő funkciója, ha a Google+ promotálásáról gondoskodik a Search Plus Your World. Vegyünk egy egyszerű példát arra miképp sérül a relevancia elve és térjünk vissza Britney Spearshez. Az énekes sokkal aktívabb Facebookon mint Google+-on, de az utóbbi közösségi portálon lévő profilja fog megjelenni, ha beírjuk, hogy „zene”.

Az Electronic Privacy Information Center(EPIC) véleménye szerint, a Search Plus Your World-el még könnyebbé válik a személyes adatokhoz való hozzáférés és, ahogy fentebb említettem előtérbe helyezi a Google saját termékét. Az EPIC ezen aggodalmak miatt fordult az amerikai Szövetségi Kereskedelmi Bizottsághoz (Federal Trade Commission – FTC).

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Dragon Go, a bűvös sárkány

2012.01.17. 12:00 Szerző: Zoltán Varjú Címkék: mobil android nuance szemantikus keresés siri hangos keresés answer engines dragon go interakció dizájn

A múlt hét híre a Google sok vitát kiváltó változtatásai mellett a Nuance Dragon Go mobil alkalmazásának bejelentése volt.

Az iPhone tulajok, különösen az új S4 széria birtokosai ódákat szoktak zengeni a Siri-ről és az Apple hallatlan innovációjáról. Ahogy azt már korábban megírtuk, a Siri egy nagyon okosan összerakott mashup, ami a Nuance beszédfelismerő technológiáját ügyesen kombinálja az SRI által kifejlesztett CALO kognitív asszisztenssel és különböző ún. válaszkeresőkkel (answer engine). A Siri akvizícióval jól járt az almás cég és a felhasználók is, a Nuance pedig volt olyan okos, hogy nem adott kizárólagos jogokat beszédfelismerő szolgáltatásához.

A Dragon Go először érdekes módon pont iPhone-ra jelent meg.

Ahogy a fenti videón is láthatjuk nem törekszik arra, hogy "teljes körű" személyi asszisztens legyen mint a Siri. Ezt a funkciót kizárólag a céges marketing anyagokban képesek ezek az alkalmazások hiánytalanul betölteni.

A Nuance-tól sem áll távol a költői túlzás, ahogy a következő kis videó is mutatja.

Miért olyan nagy dolog akkor a Go? A nyitás az Android rendszerű mobilok felé azt jelenti, hogy sokkal szélesebb kört tud elérni a Nuance. Több mint 200 (sajnos gyakran csak az Egyesült Államokban elérhető) szolgáltató oldalaihoz juthatunk el könnyedén, egy egyszerű interfészen keresztül.

 

 

 

 

Az okostelefonon egy összetett keresésre csak akkor szánjuk rá magunkat ha nincs más választásunk, hiszen az érintőképernyőn nem kényelmes a szövegbevitel.


 

 

 

 

 

 

 

A hangalapú keresés gyorsaságát csökkenti, hogy az input feldolgozására várni kell.

 

 

 

 

 

 

Viszont a (Dragon Go algoritmusa alapján) legvalószínűbb találatok szépen, szolgáltatónként elkülönítve jelennek meg egy jól átlátható felületen.

 

 

A videókban látható komplex feladatok még nem biztos hogy a világ minden táján és minden nyelven végrehajthatóak (jelenleg angol nyelvre van optimalizálva a szolgáltatás, a nagy világnyelveken pedig hamarosan elérhető lesz), hiszen ezek rendkívül bonyolult feladatok, amik megkövetelik a csatornázást (pipelining), azaz az egyik szolgáltatás outputját a másik inputként kezeli és így tovább. A problémák ellenére azonban egy roppant izgalmas irányt jelent a mobil interakció dizájn és a nyelvtechnológia terén a Dragon Go.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Kereső olvasók

2012.01.10. 12:00 Szerző: Zoltán Varjú Címkék: librarything moly.hu mendeley zotero goodreads közösségi katalogizálás

Sokan rendszerezik az online hozzáférhető hírforrásokat, pl. RSS olvasót használnak, napjainkban pedig egyre elterjedtebb, hogy Twitteren követik a hírforrásokat. Kevesebben, de még mindig szép számmal akadnak olyanok, akik valamilyen könyvjelző/közösségi taggelő szolgáltatást vesznek igénybe, mint pl. a delicious-t ami nem csak azt teszi lehetővé, hogy elmentsük és rendszerezzük olvasmányainkat, hanem mások gyűjteményeiben is kutakodhatunk pl. tagek alapján. Habár sokan építették bele ezeket az eszközöket a napi munkájukba is, természetüknél fogva hírolvasásra, személyes érdeklődésünk során talált információ rendszerezésére és rekreációs időtöltésünkre koncentrálnak. A "komolyabb" olvasmányok, mint pl. a könyvek és tanulmányok kezelésére más alkalmazásokat kell igénybe venni.

A GoodReads a könyvek szerelmeseit gyűjti egy virtuális könyvklubba.

A mai trendeknek megfelelően akár Facebook vagy Twitter fiókunkkal is beléphetünk és így egyből megtalálhatjuk azokat az ismerőseinket akik tagok. A bejelentkező oldalon láthatjuk mit olvasnak éppen barátaink, kollégáink.

A keresési eredmények tartalmazzák az olvasók értékeléseit, a találatokat felvehetjük saját listáinkba is. Olvasmányainkat rendszerezhetjük (különféle listákba rendezhetjük, kívánságlistát készíthetünk, kulcsszavakkal címkézhetjük fel stb.), ennek alapján a GoodReads rendszere érdeklődési körünknek megfelelő könyveket is ajánl nekünk. Az oldal egyrészt remek eszköz hogy a kollégákat követve szakmailag is a toppon maradjunk, ill. megtaláljuk a legmegfelelőbb regényt a következő hosszú hétvégére. Az üzemeltetők számára pedig a felgyülemlett adatok jelentenek biztos bevételt, amik egy API-n keresztül elérhetők és felhasználhatók egy e-kereskedelmi oldalnál is pl. további kapcsolódó könyvek ajánlásához.

A magyar Moly.hu is egy hasonló közösségi olvasásra kihegyezett oldal.

Alapvetően a GoodReads vonalát követi, de a keresési találatokat megjelenítő oldala sokkal barokkosabb.

 

A LibraryThing volt az első közösségi katalogizáló (social cataloging) oldal, s mint ilyen máig etalonnak számít olyan tulajdonosokkal mint az Amazon és az AbeBooks. Külön erőssége hogy nem csak angolul vagy a nagy világnyelveken érhető el, hanem pl. magyarul is.

A bejelentkezőfelület már-már puritán, de ezt inkább az erősségének tekinthetjük. Az ismerősök újdonságai mellett olvashatunk többek között ajánlókat, a boltokba kerülő újdonságok kritikáit is.

A találati oldalon a könyvészeti adatokon túl az olvasók tagjeit és kritikáit olvashatjuk.

A LibraryThing értékét a tagek adják, ezért két nagy könyvkereskedő is részesedést szerzett az oldalt működtető cégben. A könyvtárak is egyre gyakrabban fordulnak a tagekhez hogy olvasóbarátibb keresést tudjanak biztosítani olvasóiknak. A LibraryThing for Libraries ahogyan a neve is mutatja kifejezetten könyvtárak számára nyújt szolgáltatást az összegyűjtött adatokra alapozva.

Könyvolvasmányaink rendszerezésére a fenti alkalmazások remekül megfelelnek. A tudományos kutatómunka azonban megköveteli, hogy sokkal összeszedettebbek legyünk, a könyv metaadatait illik rendesen tárolni és nem árt, ha egyszerűen tudjuk gyűjteményünkből ezeket kinyerni egy-egy hivatkozáshoz amikor írunk. Szintén fontos szempont, hogy napjainkban a tudományos publikációk formája a tanulmányok felé tolódott el. Az alkalmazott kutatóknak ennél is kuszább dolga van, hiszen dokumentációkkal, technikai beszámolókkal és egyéb finomságokkal is meg kell birkózniuk.

A Mendeley egyszerre felel meg a fenti követelményeknek mint egy referencia kezelő és rendelkezik a bemutatott közösségi katalogizálók funkcióival is.

A webes felületen bejelentkezve a kollégák és a követett csoportok híreit láthatjuk

Saját gyűjteményünket is böngészhetjük online, különösen hasznos funkció hogy mások metaadatait is láthatjuk. A Mendeley erőssége a desktop alkalmazás, ebbe importálhatjuk pdf gyűjteményünket amihez jó esetben adatbázisából kikeresi a fontosabb metaadatokat. A beépített olvasóval annotálhatjuk is dokumentumainkat.

What is Mendeley? from Mendeley on Vimeo.

A Mendeley az összegyűjtött adatokra egy jól használható API-t készített, amit elsősorban a tudománymetrika (a tudományos publikációk tartalomelemzésével, a kutatók közötti kapcsolatok kimutatásával és a hivatkozások mérésével foglalkozó tudományterület) iránt érdeklődők használnak. Ez a tudomány már nem csak arról szól, hogy kik a leginkább hivatkozott kutatók. Egy adott problémát gyakran több tudományág is intenzíven kutat, de az interdiszciplinaritás nem mindig működik tökéletesen. A publikációk automatikus átvizsgálása gyorsan adhat egy összefoglalót, rávilágíthat a párhuzamosságokra és az eltérésekre az eltérő területek művelői között. Az alkalmazott kutatóknak sokat segíthet a prediktív analitika abban hogy kitalálják hogy mely elméleti kutatásokból mikor lesz gyakorlatban alkalmazható eszköz.

 

Habár a Mendeley nagyon jó eszköz, kicsit körülményes a használata. Sokan inkább az egyszerűbb Zotero-t használják, az igazi power userek pedig mindkettőt beillesztik a munkájukba. A Zotero biztosít számunkra egy tárhelyet, és lehetőséget ad arra is, hogy csoportokhoz csatlakozzunk. A hangsúly itt is a gépünkön futó alkalmazáson van, ami tkp. egy böngészőbővítmény.

Az Internet korához alkalmazkodva nem csak könyveket és tanulmányokat rendszerezhetünk vele, hanem minden más forrást is. A fejlesztők dolgoznak egy a Mendeley-hez hasonló különálló alkalmazáson is.

De miért is használjunk ilyen alkalmazásokat? Adnak ezek valami mást mint kedvenc online könyváruházunk, vagy könyvtárunk online katalógusa? A közösségi katalogizálás nagy előnye, hogy nem a könyvtári osztályozáson alapul, hanem a felhasználók saját elképzelései mentén kerül egy-egy kötet osztályozásra. A felkerülő kritikák nagyobb valószínűséggel tárgyilagosabbak mint az eladásban érdekelt felek értékelései. Azonban a legnagyobb élményt a közösség adja. A barátok és ismerősök olvasmányai felfedezésre sarkallnak minket, az általunk ismeretlen tagok is segítenek tökéletesíteni az ajánló rendszert és olyan olvasmányokra is bukkanhatunk melyekkel más módon nem találkoznánk. Szintén gyakori probléma hogy az embert saját érdeklődése "bezárja" egy saját kis világba, ismerőseink - mivel gyakran magunkhoz hasonló emberekkel kerülünk egy közösségbe - ebben csak megerősítenek minket. Módszeres felfedezéssel ezen eszközökkel tágíthatjuk látóterünket és hatással lehetünk közösségi hálónkra is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Az oroszok már a spájzban vannak, bádogosokkal, receptekkel, bölcsészekkel

2012.01.03. 12:00 Szerző: Zoltán Varjú Címkék: keresés 2011 leg

2011 legolvasottabb posztjait szedtük össze, hogy legyen mihez viszonyítani idén.

 

1. Liszt, só, víz, Internet - avagy a nagy receptkereső összehasonlító teszt

Kedves olvasóink a jelek szerint nem csak a Kereső Világot, hanem a hasukat is szeretik, ennek eredménye a nagy receptkereső teszt első helyezése.
 

2. Pharmindex gyógyszerkereső alkalmazás

Reméljük hogy a Pharmindex helyezését egyedül a receptkeresőkön talált jobbnál-jobb ételek túlfogyasztását enyhítő patikaszerek iránti kereslet szülte.

3.
Kereső Mobilvilág

Az e-könyvünket beharangozó poszt is dobogós helyezést ért el.

4. Minden, amit tudni lehet a Yandexről
Az orosz Yandex keresőt Tempfli Péter (a Számítógépes nyelvészet blog egyik szerzője) mutatta be egy vendégposztban.

5. Megújult a Google képkeresés - téma szerinti rendezés
A Google-el kapcsolatos hírek mindig népszerűek. A Mountain View-i óriás sok újítást vezetett be tavaly, az ezekről szóló írásaink sokakat vonzottak, de reméljük sikerült megmutatni nekik hogy "több a keresés, mint csupán guglizni".

6. Kereső tanfolyam - 7. Vizualizáció
Még 2010-ben kezdődött el a kereső tanfolyam sorozat, ennek befejező részét (hasonlóan a korábbi írásokhoz) sokan olvasták 2011-ben.

7.
Bölcs keresők
Mi sem mehettünk el az egyre elterjedtebb digitális bölcsészet mellett, és olvasóink jöttek velünk. Reméljük hamarosan magyar kezdeményezésekről is beszámolhatunk.

8.
A Google belehúzott
A Google egységesítette szolgáltatásait, ráncfelvarráson esett át a UI is, valamint megjelent a G+.

9. Keresőteszt: Mekkora az átfedés a Google és más keresők találatai között?
Az örök kérdésre kerestük a választ, s ezzel a jelek szerint nem voltunk egyedül.

10.
"Tudsz egy jó bádogost...?" - joszaki.hu
Örömmel mutattuk be a Jószaki.hu oldalt, hiszen sajnos egyre gyakrabban fordul elő hogy nem talál az ember jó szakembert a ház körüli munkák elvégzésére.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Keressünk közösen!

2011.12.20. 12:00 Szerző: Zoltán Varjú Címkék: p2p keresés jövője faroo alternatív keresőfelület peer to peer yacy

A nagy keresőket gyakran kritizálják mivel algoritmusaik hétpecsétes titkot képeznek és a keresési eredményeik néha vitathatóak. Szintén sokan kérdőjelezik meg a nagyok adatkezelési eljárásait és fogalmaznak meg jogi/etikai kifogásokat bizonyos gyakorlatokkal szemben. Most két olyan, ún. peer-to-peer alapú (p2p, azaz egyenrangú partnerek közötti) keresőt mutatunk be, melyek a fenti kérdésekre kényes felhasználókat is messzemenően kielégítik.

 

Peer-to-peer számítás

 

A nagy számításigényű feladatok megoldására találták ki a kispénzű, de lelkes kutatók az ún. Grid számítást. Ez röviden annyit tesz, hogy az internethez kapcsolódó felhasználók egy kis programocska letöltésével felajánlhatják számítógépeik szabad kapacitását egy-egy nagyobb ügy érdekében. Sok kicsi sokra megy alapon akár a szuperszámítógépek teljesítményét meghaladó számítási kapacitást is el lehet ily módon érni, ha kellő számú felhasználót sikerül meggyőzni a kutatási célok fontosságáról. Ilyen elven működik pl. a földön kívüli élet jelei után kutató SETI@home projekt ami a kutatók körében népszerű BOINC rendszert használja (a SZTAKI kutatásaiba is bekapcsolódhat a program letöltésével a kedves olvasó, további információk a SZTAKI Desktop Grid oldalán). A Grid rendszerek esetében egy (vagy több) központból osztják szét a csatlakozott felhasználók között a részproblémákat, ezeket a gép feldolgozza, majd visszaküldi a központba.

 

A peer-to-peer rendszerek a Grid-hez hasonlóan az egyes felhasználók gépein futó kis programokból állnak, melyek az interneten kommunikálnak. Azonban a p2p megoldások esetében nincs központi szerver ami koordinálná a folyamatot. Talán a legismertebb ilyen megoldás napjainkban a BitTorrent, ami peer-to-peer elven működő fájlmegosztás.

 

Szerencsére már hazánkban sem hangzik idegenül az önkéntesség elve, amit érdemes kihangsúlyozni a legtöbb grid és p2p kezdeményezés esetében. Nem csak az illegális fájlmegosztásra jók ezek a szoftverek, hanem biztosítják a széles tömegek bevonását a tudomány és technika világába (participatory science) s egyben elősegítik bizonyos szinten a tudomány demokratikus működését is (az oktatás egyik formája és a kontroll gyakorlása is lehet egyben ez – l. citizen science).

 

FAROO

A FAROO a Windows felhasználók számárára fejlesztett p2p keresőt. A program telepítése után a Firefox vagy az IE böngészőben használhatjuk, de lehetőség van arra is hogy “rendes” programként futtassuk. Maga az eszköz könnyen használható és szubjektív ítéletünk szerint egészen elfogadható találatokat ad. Fontos megjegyezni hogy vannak bizonyos korlátai, mivel az indexelt oldalak száma a felhasználói tábor nagyságával áll egyenes arányban, az indexelés pedig nagyban függ a felhasználók internetezési szokásaitól. A felhasználók tábora az önszelekció elvén működik (azaz nem egy reprezentatív minta), ezért az ilyen projektek iránt fogékony emberek által látogatott oldalak (és az általuk használt nyelvek) torzítják a találatokat (habár a készítők állítják hogy ezt kiküszöbölték).

 

YaCy

A YaCy a FAROO-nál ambiciózusabb vállalkozás. Nem csak p2p elven működő kereső, hanem olyan megoldás is amit akár saját honlapunk “alá is rakhatunk”, vagy saját (inter- vagy intranetes) keresőt is építhetünk vele. Eredményei használhatóak, de a fent ismertetett hátrányok rá is vonatkoznak.

 

Habár a p2p keresők nem közelítik meg a nagyokat, vállalható alternatívát jelentenek a geekek számára.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása