HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

Főbb témák

adatbányászat (6) adatok (12) adatújságírás (16) adatvizualizáció (17) AI (12) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (48) bing (14) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (14) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (13) Google (23) google (57) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (57) kereséselmélet (7) keresés jövője (55) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (43) könyvajánló (23) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (6) LDA (10) lda (10) live (13) magyar kereső (9) marketing (8) meetup (40) mesterséges intelligencia (10) metafora (6) mobil (37) mobil keresés (17) Neticle (8) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (28) nyelvtechnológia (73) open data (11) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (46) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (18) szemantikus kereső (9) szentimentelemzés (34) szövegbányászat (15) társadalomtudomány (7) tartalomelemzés (54) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) twitter (15) Twitter (18) vertikális kereső (9) vizualizáció (11) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Lehetsz okosabb, mint a Google? Hírkeresés okosabban

2010.10.01. 15:05 Szerző: kereso Címkék: keresés problémái polymeta hírkeresés

Ma a legtöbb keresés esetében olyan mennyiségű találat van, hogy szinte lehetetlen észrevenni, ha egy kereső rosszul kezeli a magyar nyelvi ragozott alakokat. Más a helyzet a hírkeresésnél.

A hírkeresés olyan témakör, amikor a hír frissessége sok minden mást megelőzhet a relevancia szempontok közül. Ilyenkor fény derülhet turpisságokra. Ha ugyanis nem dátum szerint sorrendezünk, akkor bizony 20 napos szakállas hírek is az első oldalra kerülhetnek.

Keressünk például az "eu soros elnökség" kifejezésre a Google hírkeresőjében dátum sorrendben (vagy akár az elmúlt 24 órában). A cikk írásának pillanatában az első 10 találatból 4 esetében mondhatjuk el, hogy témájában érinti a keresett témánkat. Van szó a Román Postáról, magyar köztársasági elnök zágrábi látogatásáról, kínai nemzeti napról az expón, a magyar biogáz egyesületről, vagy éppen a Csemadokról. Lehetne ezt jobban is csinálni? Igen, ha a "soros"-ból nem csinálna sor-t, illetve az "elnökség"-ből pl elnöke-t...

 

És, hogy ne csak bort igyunk és vizet prédikáljunk, be is mutatnám, hogyan lehetne jobban. Ha ugyanezt a példát a PolyMeta-n próbáljuk meg, ami egyébként szintén a Google hírkeresőjét használja, akkor más, sokkal relevánsabb találatokat kapunk.

(A PolyMeta a WebLib keresője, melynek ügyvezetője vagyok)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

3 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

http://kereses.blog.hu/api/trackback/id/tr1002337345

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

miti88 · http://fitt-es-egeszseges.com/ 2010.10.01. 20:27:41

Szerintem ez nem csak a google hibája. Sok netező nem használ ékezeteket, és "sor" -t ir mikor "sör" -re gondol. Egy programnak meg elég nehéz lehet kitalálni hogy mire gondoltak, igy keletkezhetnek ilyen hibák a találati listákban.
Egyetértek viszont azzal, hogy egy csak a magyar nyelv számára specializálódott kereső, talán jobban tudja kezelni a hasonló problémákat.

kereso · http://kereses.blog.hu 2010.10.05. 21:55:35

@Alex79: Nem olvastad el figyelmesen a cikket :)
Pont erről szól, hogy ha megnézed így a cikkek között a legelső pl egy szeptember 11-i, amit nehezen lehetne friss hírnek nevezni. Ha viszont átváltasz dátum szerinti sorrendre, akkor rögtön jelentkezik a probléma...