HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Meg lehet verni a Google-t a keresésben?

2008.04.17. 11:30 Szerző: Kereso75 Címkék: google keresés jövője

Nitin Karandika írja le a Powerset szemantikus kereső kapcsán, hogy szerinte miért nem lehet ma már a Google-t megverni.

Három fő érvet használ:

  1. Relevancia algoritmusok: már annyira kifinomult a relevancia algoritmusuk, hogy egyszerűen szerinte jobb eredményeket ad, mint pl a Yahoo. A valós felmérések eredményei nem ezt bizonyítják, mindenesetre sok embernek nyújtja ezt az érzetet, a Google az kétségtelen, és tény, hogy a termékeket nem elsősorban a valós tulajdonságaik, hanem az általuk adott érzet adja el a vásárlóknak.
  2. Optimalizált weboldalak: Számomra ez már meggyőzőbb érv. Nem csak a Google optimalizál, hanem minden weboldal maga is optimalizál a Google-re. Mivel nagyjából ismert, hogy milyen dolgok fontosak a számára, ezért minden értelmes weboldal tulajdonos energiát szán arra, hogy megfeleljen minél inkább a Google számára. Ez óriási versenyelőnyt jelent a számukra.
  3. Felhasználói bázis: a legtöbb felhasználó lassan harap rá új technológiákra. A több ezer létező alternatív keresőszolgáltatás ellenére, ezek összesített piaci részesedése nem éri el a 2 százalékot. A legtöbben egyszerűen nem is gondolnak arra, hogy lehetne mást is használni. Hozzászoktak a végletesen egyszerű kezelő és eredményfelülethez. Egyszerűen ezt várják el bármelyik keresőtől. Már arról is nagyon nehéz meggyőzni a felhasználókat, hogy próbáljanak ki egy alternatív lehetőséget, nem hogy aktív felhasználóvá váljanak.

A legsúlyosabb korlátot a harmadik tényező jelenti, ugyanis ha valaki keresőt fejleszt, nagyon gyorsan szembesül a ténnyel, hogy az átlagosnál jóval nehezebb látogatókat vonzania. Az oldal jellegéből adódóan, ugyanis kevés a tartalom, amit más keresők indexelni tudnak.

Van még egy nagyon jelentős korlát, mégpedig a hagyományos crawler alapú indexelés óriási erőforrás igénye. A Google gyakorlatilag együtt nőtt fel a webbel. Amikor elkezdték, még néhány géppel meglehetett oldani, ma már nagyon komoly szerverparkok szükségesek a feladathoz. Itt nagyon nagy tőkére van szükség, még akkor is, ha valaki valami nagyon újszerű megközelítéssel is áll elő, mint az igen komoly szakmai háttérrel rendelkező Cuill tette. Ők azt ígérik, hogy nagyságrendekkel kevesebb kapacitással megoldják. Ehhez kellett most 25 millió dollárt szerezniük, a további fejlesztésekhez...

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

5 komment • Kövess Facebookon • Iratkozz fel értesítőre

Bár kitalálhatnám, mit akartál keresni!

2008.04.11. 14:40 Szerző: Kereso75 Címkék: kereső szándéka szándékadatbázis

A keresés egyik alapproblémája, hogy nem ismerjük a kereső szándékát. Mire kíváncsi valaki, aki a mars szóra keres? Csillagászat, csokoládé esetleg római mitológia? Természetesen ha pontosítjuk a keresőkifejezést, akkor a találataink is pontosabbak lesznek.  A SearchEngineLand-en olvastam a Penn Egyetem májusban megjelenő tanulmányáról, amiből megosztanék néhány érdekességet.
A webes keresések 80 százaléka információs, 10-10 százaléka pedig navigációs (keresek egy internet oldalt), illetve tranzakciós (pl. vennék valamit) természetű. Ha ezt tudják a keresők, segíthet, hogy a hasonló bizonytalan témák keresése esetén milyen jellegű találatokat, milyen arányban adjanak vissza. Egyébként ma már ezt általában figyelembe is veszik a keresőrendszerek (egy elrettentő kivétel: miért kellenek tematikus keresők?)

A kutatás másik érdekessége, hogy készítettek egy automatikus osztályozó rendszert, amely eldönti, hogy a fenti három kategóriából melyikbe tartozott egy keresési kifejezés. A különböző  keresési típusok jellemzői:

  • Navigációs keresés: cégek, szervezetek, személyek neve, domain nevek, rövid keresési kifejezések.
  • Tranzakciós keresés: filmek, zeneszámok, szövegek, receptek, képek, letöltésre utaló kifejezések, szórakozási kifejezések, interakciós kifejezések (vásárlás, chat stb)
  • Információs keresés: kérdőszavakat tartalmazó keresések (hogyan, mi stb), hosszabb keresőkifejezések, nem csak az első találati oldalt nézték meg stb.

Jelenleg a keresések 74 százalékában jó eredményt érnek el, ami egyrészt bíztató, másrészt aki már fejlesztett hasonló rendszereket az tudja, hogy a 80 százalékosan jó megoldást mindig sokkal könnyebb elérni, mint onnan továbblépni.
Ha valakit érdekel a komplett tanulmány (Determining the informational, navigational,
and transactional intent of Web queries) emailben el tudom küldeni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Univerzális keresés

2008.04.09. 09:20 Szerző: Kereso75 Címkék: google yahoo univerzális kereső

Kevin Newcomb ír a SearchEngineWatch blogon arról, hogy a tavalyi évben a Yahoo és a Google által bevezetett univerzális találati oldalak valóban megváltoztatták a felhasználók viselkedését. A koncepció lényege, hogy egy keresés során nem csak szöveges találatokat adnak a felhasználónak, hanem kép, videó vagy éppen hírforrásokból is jönnek eredmények. Mára kiderült, ha mindezt egy képernyőn látja a felhasználó, akkor sokkal nagyobb arányban kattintanak ezekre az alternatív forrásokra, mint ha külön-külön kellett volna végrehajtani ezeket a kereséseket.

Természetesen van a kérdésnek keresőoptimalizálásra ható következménye, miszerint nem elegendő az oldalakat csak a szöveges tartalomra optimalizálni, de ennek a taglalását inkább meghagynám a hozzáértőknek.

Ezt a gondolatot vittük mi még tovább, amikor a metakeresőnkben mindezeket megjelenítjük, ugyanakkor nem tesszük őket egy közös listába. Számomra nem alátámasztható semmilyen logikus magyarázattal, hogy a videótalálatok mondjuk miért pont a 3. helyen jelenjenek meg. Tehát nálunk a főkategóriában a magyar webről érkezett eredmények jelennek meg, jobboldalon jön a web, a hírek, a kép, videó valamint a blog kategória. Természetesen a koncepció más területeken is alkalmazható. Készítünk például az NIH számára olyan AIDS témájú vertikális keresőt, ahol orvosi képadatbázisokból is mutatunk eredményeket.

Kapcsolódó cikkem: Yahoo újdonságok

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Keresőverseny

2008.04.03. 10:11 Szerző: Kereso75 Címkék: internetes keresés

Hétről-hétre nagyon sok érdekes kereső jelenik meg, vagy lép előre valamilyen területen. Charles Knight AltSearchEngines blogja a legjobb, ami ilyen kezdeményezésekről beszámol. Ő indította a TheSearchRace szolgáltatást, ami áttekinthető és értékelhető formában teszi elérhetővé a különféle keresőket. Ha beregisztrálsz, szavazhatsz melyik tetszik a legjobban, illetve felhívhatod valaki más figyelmét, ha találsz valami érdekeset.

Két dolgot kérnék tőletek:

- ha találtok érdekes keresőt az oldalon, jelezzetek, és szívesen írok róla a blogon

- illetve szavazzatok az AllPlus keresőre, amit mi fejlesztünk, ha érdemesnek tartjátok. A browse category-re kattintva a Meta Search csoportban találjátok

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Újszerű keresési felület

2008.03.28. 16:06 Szerző: Kereso75 Címkék: keresés jövője alternatív keresőfelület

Alapvetően kétféle "iskola" létezik, amikor a keresők jövőjéről gondolkoznak. Az egyik szerint a kulcs az algoritmus, vagyis a találatok sorrendezése, a másik szerint pedig a találatok újszerű megjelenítése. A második területre koncentrál elsősorban a searchme, melynek demoját itt meglehet nézni, illetve be is lehet regisztrálni hozzájuk béta tesztre.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása