HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

State of the Empire - a Birodalom helyzete

2011.01.10. 10:51 Szerző: Vajda Gábor (Gabor_V) Címkék: google spam keresés internetes keresés

Az elmúlt időkben egyre erősödtek a Google keresési eredményeit kritizáló hangok. Míg a cégóriás a számítástechnika és az Internet minden sarkában ott van - és még azon kívül is, ld. pl. a kísérleti önjáró autót -, úgy tűnik, éppen a vállalat gerincét jelentő Google kereső és egyéb más keresési szolgáltatásai küzdenek jelenleg problémákkal.

Jelen állás szerint - kereséssel élve - egy adott weboldalra közel 90%-ban a Google keresőn jutnak el az emberek. Ez hatalmas felelősséget jelent a cég számára ha releváns információkhoz akarja juttatni az alkalmazást igénybe vevőket. Márpedig úgy tűnik, éppen ebben hibádzik.

Mielőtt azonban kifejtenénk, kicsit dőljünk hátra és nézzünk meg egy rövid jelenetet a Monty Python repülő cirkuszából, amely tökéletesen, szó szerint írja le a problémát (0:30-tól):

Angolul kevésbé értő olvasóink részére elmondjuk, hogy a jelenetben a "spam" kifjezés a konzerves löncshúsra utal, és mint ilyen, a megjelenített étterem kínálatának csaknem minden egyes pontjában megtalálható, és nem is tudnánk olyat kérni amiben ne szerepelne az említett összetevő.

A Google kereső nyugati igénybevevői is egyre nagyobb számban ütköznek a spam problémájába a találati listát illetően. A magyar nyelvű Google ilyen szempontból kevésbé releváns, hiszen egészen kis szeletét jelenti a teljes cégóriásnak, talán kisebb figyelem is összpontosul ide (bár a magyar csoport nagy erőfeszítéseket tesz ezek kivédésére). Az azonban meglehetős belső gondokra vagy egyszerű oda nem figyelésre utal, ha az angol nyelvű találatok közé is egyre nagyobb számban férkőznek be a spamek.

A kritikus hangok többsége az ún. "scraper site"-ok (talán "túszejtő oldalnak" nevezhetnénk magyarul) felülreprezentáltságát emeli ki. A túszejtő oldal egy másik oldal tartalmát lemásolja, majd ugyanazt jeleníti meg saját felületén, "pénzt követelve" érte - vagyis reklámokat helyez el mellé. Ha azonban minél több reklám (kiváltképpen ha Google hirdetésekről van szó) és rengeteg más, amúgy oda nem illő cimke szerepel a tartalommal kapcsolatosan, a kereső hajlamosabb a túszejtő oldalt a keresési eredménylistában előbbre helyezni mint az eredetit.

Ez pedig károkat okozhat mind a tartalmat eredetileg előállító oldalnak (mivel a forgalom nem oda megy), mind a keresőnek egyaránt (a látogatókat eltántorítja).

Olyan véleményeket is lehet már olvasni, hogy a Bing is jobb eredményeket szolgáltat, de a Microsoft szolgáltatása egyértelműen abból a hátrányból indul, hogy lényegesen kisebb a "lefedettsége", szűkebb tartalomból lehet válogatni. A Google használata már csak ezért is nélkülözhetetlen.

A probléma természeténél fogva két részből áll. Mivel egy többé-kevésbé egyszerű keresési algoritmus felülvizsgálatról és javításról van szó (ami elméletileg nem okozhat túl nagy fejtörést), a teher a másik oldalra helyeződik át, vagyis a Google miért nem tesz/tett valamit korábban ennek kivédésére, miért várta meg az elégedetlenkedők hangját?

Márpedig ez az a kritika amelyet a legtöbben felvetnek, hiszen a szakmához valamennyit is értők egyöntetűen elismerik, hogy 100%-os rendszert soha nem lehet készíteni. Így mindig lesznek olyanok, akik megtalálják és ki is használják a törésvonalakat.

Valószínűsíthető, hogy a cég rakétaerejű növekedése következében előállt figyelem, teendők és prioritások túlzott megosztása a baj gyökere. Ez önmagában egy természetes jelenségnek tudható be, azonban arra minden cégnek oda kell figyelni, ha a vállalat alapját, kiindulópontját fenyegeti ilyen veszély.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr672573609

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Tea Cher 2011.01.11. 11:48:59

Különben dolgoznak ám rajta folyamatosan... Pont egy olyan projekten dolgozom, ahol emberekkel értékeltetik a kereséseket, h. mennyire relevánsak a keresőkifejezések szempontjából...gondolom nem hiába...
süti beállítások módosítása