HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Kereső tanfolyam - 7. Vizualizáció

2011.01.03. 11:26 Szerző: Vajda Gábor (Gabor_V) Címkék: keresés vizualizáció kereső tanfolyam internetes keresők

Az internetes keresés legnagyobb problémáját maguk a felhasználók jelentik. Hiába látják be a keresőgépek a web egyre nagyobb részét és rendezik a találatokat egyre kifinomultabb algoritmusok szerint, a felmérések azt mutatják, hogy a keresőket használók többsége csak 1-2 találatot nyit meg és néz meg közelebbről, néhányan 3-4-et, és 8-10-nél többet szinte senki sem, így alig van esélye arra, hogy az illető a számára valóban legrelevánsabb, leghasznosabb weblapokat, illetve szöveges és multimédia dokumentumokat találja meg - az emberek többsége megelégszik a "jó lesz ez is" szinttel. A találati halmazok jobb áttekintését egyes keresőrendszerek és -agentek vizuális technikákkal próbálják elősegíteni: 2 és 3 dimenziós grafikus megjelenítéseket alkalmaznak, támaszkodva a legújabb szemantikus webes fejlesztésekre, az XML alapú adatcsere technikákra, a tématérkép (topic map) fejlesztések eredményeire. Mivel a képi információt (szín, mintázat, alak, méret, pozíció stb.) az agy nagyságrendekkel gyorsabban dolgozza fel, mint a szövegest és tovább is emlékszik rá, ezért ezek a módszerek alkalmasabbak legalább az első átfogó tájékozódáshoz, egy nagyobb információforrás áttekintéséhez, mint a hagyományos szöveges listák.

Bár a vizuális keresők első látásra szokatlannak, nehezebben megtanulhatóknak látszanak, és néha öncélúnak vagy haszontalannak is, de vannak köztük olyanok, amelyeket ha jobban megismerünk, akkor rájövünk az előnyeikre és jóval hatékonyabban tudunk velük bizonyos típusú keresési feladatokat megoldani. Viszont mivel ez egy viszonylag új, gyors fejlődésben és változásban levő terület, ezért gyakori, hogy az ilyen szolgáltatások és szoftverek nem teljes értékűek (hiányoznak vagy rosszul működnek egyes funkciók) és az is, hogy egy idő után eltűnnek a webről - vagy azért, mert sikertelenek voltak, vagy pedig éppen hogy túl sikeresek lettek és ezért eladták őket valami nagyobb befektetőnek és fizetős termékekbe épültek be. Ez történt a vizuális keresőkkel foglalkozó szakirodalomban gyakran hivatkozott amerikai fejlesztésű, klaszterezett halmazokat felrajzoló Grokker-rel és a francia eredetű, térkép- vagy gráfszerű megjelenítést nyújtó KartOO-val - illetve annak "testvérével", az Ujiko-val - is: előbbi 2009-ben, utóbbi fejlesztés pedig 2010 elején tűnt el a nyilvános webről, 7-8 évi működés után. Ugyancsak 2010-ben zárt be az Amazon, a Lastfm, a Youtube, a Yahoo!, a Google és más szolgáltatások találati listáit sokféle nézetben megjeleníteni képes amerikai Viewzi, amely pedig csupán két évvel korábban, 2008-ban jelent meg béta-teszt állapotban, és azonnal nagyon jó kritikákat kapott. A felhasználók által ismert nagy keresőgépek is elindultak a vizualizáció irányába, de még igen kezdetleges megoldásaik vannak: a Bing Visual Search oldalán csupán néhány előre definiált műfajban és témában lehet keresni, a Google Timeline és Wonder Wheel nevű funkciója pedig nagyon szegényes megjelenésű (utóbbit 2010 szeptemberétől el is dugta a Google, és csak akkor érhető el, ha kikapcsoljuk a Google Instant opciót a keresési beállítások közt). A látványra épülő keresési folyamat- és eredmény-megjelenítés valódi lehetőségeit akkor tudjuk felmérni, ha kipróbálunk néhány, kifejezetten erre specializálódott alkalmazást - melyek persze többnyire a nagy keresőgépek API-jait használják, vagyis az ő adatbázisaikon futtatják le a kereséseket, és a kapott adatokat elemzik és jelenítik meg a saját technológiájukkal.
 

TouchGraph

A new-yorki székhelyű vállalkozás 2001-ben indult azzal a céllal, hogy a Google számára fejlesszen egy vizuális megjelenítőt. Azóta már az Amazon, a Facebook és más információforrások is felhasználták ezt a Java alapú alkalmazást. A Google-re épülő böngésző felület valójában nem a találatokat jeleníti meg, hanem azokat a site-okat és a köztük levő kapcsolatokat, amelyekről a találatok származnak. Így nem annyira keresésre, hanem egy téma eloszlásának áttekintésére, illetve a web egy szeletének feltérképezésére alkalmas. (Érdemes a Title label-t bekapcsolni, hogy a honlapok neve jelenjen meg az URL címük helyett). A megjelenített kapcsolati háló az egérrel mozgatható, a görgővel közelíthető/távolítható, az egyes csomópontokra duplán kattintva pedig az adott site-hoz hasonló további webhelyek adatai tölthetők le (Ezt háromszor ismételhetjük, minden alkalommal újabb max. 10 kapcsolódó hellyel bővül a kép.) A site-halmazt a program eltérő színű klaszterekbe csoportosítja, ezek azután ki-be kapcsolhatók, akárcsak az egyes webhelyek ikonjai. A kiválasztott site-ról érkezett találati oldalra is továbbmehetünk, akár a bal felső sarokban megjelenő honlapleírás feletti URL címre, akár jobb gombbal a site ikonjára kattintva és a Launch Website menüpontot választva (de ehhez a felugró ablakokat engedélyezni kell a böngészőben).
 

oSkope

A svájci és német programozók által fejlesztett, 2007-ben publikussá vált megjelenítő felület a legnépszerűbb oldalak (pl. Amazon, eBay, Flickr, Youtube stb.) tartalmában keres és a képként megjelenő találatokat különféle stílusokban rendezi el (ezek a bal szélen levő ikonokkal választhatók). A graph nézetben még plusz információkhoz is jutunk, mert a képek elhelyezése ilyenkor például az Amazon esetében az árakat és a népszerűséget (eladott példányszámot) jelzi. A képeket azután szabadon rendezgethetjük, több fokozatban nagyíthatjuk, sőt egy saját mappába is gyűjthetjük (My folder fül), aminek a címét azután megoszthatjuk az ismerőseinkkel. Természetesen itt is továbbmehetünk a találat eredeti forrására, a Link to original page feliratra kattintva.

Quintura

Az amerikai és orosz központtal rendelkező cég eredetileg egy letölthető keresőügynök szoftvert tett közzé (2005-ben), de egy évvel később az online változatot is megjelentették. Komolyabb használathoz érdemes az előbbit telepíteni, mert sokkal gyorsabb és több funkciót kínál. A reklámszövegében az áll, hogy a szokásos egysoros parancsmódú keresőmezővel szemben a Quintura program vizuális felületével keresni olyan, mintha DOS-ról Windows-ra váltanánk. Egy másik hasonlat szerint pedig a Quintura egy mindentudó könyvtáros. ;-) Bár ez utóbbi állítás kérdéses, de az valóban igaz, hogy ez a szoftver nem csak és nem elsősorban a találati halmazok áttekintésében és rendszerezésében segít, hanem a találatokból kiszűrt szavak közötti kontextust mutató címkefelhőjével és a hozzá tartozó szerkesztői funkciókkal nagyon hasznos eszköz a keresőkérdések összeállításában, sőt az egész keresési folyamat menedzselésében. Többféle keresőgépet és egyéb forrást is beállíthatunk (pl. Altavista, Google, Metacrawler, Yahoo!, Amazon, Scirus, Wikipédia stb.), de egyszerre mindig csak egyikből kapunk találatokat.

A találati listák méretét érdemes legalább 250-re állítani az Options alatt (Number of found links...), hogy legyen elég kielemezhető adat a Quintura számára, és a Coverage skálát is maximumra állítani, hogy minél többet lássunk a keresés pontosítására felajánlott címkékből. Ha rávisszük a kurzort egy szóra, akkor azonnal megmutatja, hogy hogyan változna meg ezzel együtt a találati lista, majd egy kattintással fel is vehetjük a szót a keresőkérdésbe (Currenty query). Az üres területre duplán kattintva a címkefelhőben nem szereplő szavakat is hozzáadhatunk a keresőkifejezéshez. A szavak melletti X-szel kizárhatunk nem kívánt fogalmakat (ezek az Excluded fülre kerülnek, ahonnan később visszahozhatók), vagy a jobb gombbal eltüntethetjük (Hide) őket a felhőből, ha érdektelenek (ezek ettől még előfordulhatnak a találatok között). Ha túl kevés találatunk maradt az eredeti keresőkérdés átfogalmazása után, a More results gombbal kérhetünk továbbiakat, valamint a keresőkérdésre kattintva lefuttathatjuk azt a megszokott böngészőnkben is. Nemcsak a korábbi kérdéseinket módosíthatjuk, hanem a bal felső sarokban levő New query ikonnal teljesen újakat is hozzáadhatunk a Scope-hoz, vagyis a keresési folyamathoz. A teljes folyamat, a címkefelhő aktuális állapota, a találati lista és minden beállítás egy projektként elmenthető és később újra aktiválható. Ilyenkor a program külön kigyűjti a New links fül alatt a korábbi futtatás óta megjelent új találatokat.

A találati listából mi is megjelölhetjük a számunkra fontosakat (Add to Favorites), vagy törölhetjük az irrelevánsakat (Removed links) - ez utóbbi esetben a program felajánlja, hogy a kizárt találatokhoz tartozó kulcsszavakat is törli a címkefelhőből és a keresőkérdésből. A Quintura bár egy viszonylag egyszerű agent, mégis nagyon jól használható komplex webkeresések összeállításához, főleg olyankor, ha nem ismerjük a kérdéskör kulcsfogalmait, vagy ha időnként újra ugyanolyan vagy hasonló kereséseket kell végeznünk.

 

Összeállította: Drótos László, Magyar Elektronikus Könyvtár

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr192556203

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása