HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Helyi keresés: hol tart a piac?

2007.09.24. 22:23 Szerző: Kereso75 Címkék: helyi keresés tematikus keresés szakmai kereső

A helyi keresésről korábban írt cikkemben arra jutottam, hogy gyengén állunk még ezen a területen. Nekem úgy tűnik, hogy a különböző kisvállalkozások, üzletek, éttermek, boltok - amelyeket a leginkább érintené az ilyen keresők forgalma - egyszerűen nem tartják még fontosnak az internetes megjelenést. Hiába a legjobb adatbázis, ha nem viszik fel a cégek az adataikat, mert vagy nem tudnak a szolgáltatásról, vagy egyáltalán fel sem merül bennük, hogy bármilyen értelme lenne az interneten megjelenniük. Az általam megnézett oldalak közül több is teljesen megfelelő lenne a célra technikai szempontból, mégis kevés az információ még bennük.
Sok esetben érdemes lenne speciális keresőt használni, az általános kulcsszavas keresők helyett. Ugyanis hagyományos keresővel leginkább olyan cégeket lehet megtalálni akik honlappal rendelkeznek. Nem gondolnám, hogy egy virágosnak, cukrászdának, kulcsmásolónak vagy hasonló kis üzletnek honlapra lenne szüksége, de arra igen, hogy akár az interneten is megtalálhassa valaki. Erre lennének alkalmasak a helyi, szakmai keresők, ha a  vásárlók és a vállalkozások egyaránt tudnának róluk, és használnák őket.

Nem az a baj, hogy magyarországi üzleti világ nem érett még meg erre a szolgáltatásra?
Mindenesetre addig is: kisvállalkozások, regisztráljatok!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Keresők gyerekeknek

2007.09.22. 20:15 Szerző: Kereso75 Címkék: játék gyerekek tematikus kereső játékkereső ovisok

6 és 4 éves lányaim már aktív internetezők. Nem egyszer lepődtem már meg, hogy milyen természetességgel használnak angol nyelvű oldalakat, pedig olvasni még magyarul sem tudnak. Valahol ez természetes, hiszen egy (kis)gyerekeknek szánt oldal nem építhet az olvasni tudásra. Ezért természetesen náluk a klasszikus értelemben vett keresési megoldások még nem működnek, sokkal inkább a katalógusszerű oldalak.

Hol keresnek tehát Luca és Eszter, a két családi játékszakértő?

Gribedli: Jelenleg ez a favorit náluk. Nemrégiben egyébként megújult a design, ami korábban egészen egyszerű volt, de ez őket cseppet sem zavarta, hogy végigpróbálják a különböző oldalakat. Az alapötlet, hogy kisméretű képek jelzik a különböző oldalakat, ami egyszerűen lehetővé teszik az olvasni nem tudó gyerekeknek is a tájékozódást.

Valószínűleg azért is ez a kedvenc, hiszen pont az ő korosztályukat célozza meg.

Startlapjatekok: Itt már nagyobbak számára is vannak játékok. Az eltérő célcsoportot az is jelzi, hogy feliratokat is találunk az oldalon, és játéktípus alapján kategóriába sorolták. Van még heti és összesített ranglista is, ahol egyébként éppen az egyik kedvencük, a Paperdoll Heaven az első. Hát igen, már az öltöztetős baba is virtuális lett...

A végére még egy, ami már tényleg kereső ez pedig a Kacifánt, ahol kulcsszavak megadásával lehet keresni. Mi értelme van egy ilyen keresőnek? Magukat védett tartalmú keresőnek nevezik, és pontosan itt van a lényege. Nem szeretnénk esetleg például, ha a gyermekünk a barbie szóra a "Suicide Bomber Barbie" találattal találkozna, ami például a Google 9. találata a témában. Nevezhetjük a kacifántot is tematikus keresőnek, és ebben az esetben nagyon is érdemes foglalkozni a találati oldalak körének a kiválasztásával. Sajnos nem találtam meg, hogy kik a fejlesztői az oldalnak, így arról, hogy ezt milyen úton érik el, nem tudok beszámolni.

Rövid tesztem során is találtam az oldalnál hibás működést (pl a képkeresésnél egy jóízű sql hibaüzenet érkezett), de nem szeretném kritizálni a fejlesztőket, inkább biztatni, hogy csak finomítsák tovább az ötletet, hiszen az angol nyelvű hasonló keresők is - a Search Engine Land cikke alapján - sokszor még gyerekcipőben járnak.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Hogyan nézzük át a találatokat?

2007.09.21. 08:41 Szerző: Kereso75 Címkék: clustering tartalomjegyzék találati oldal

Longhand SEO Blogján van egy nagyon érdekes cikk arról, hogyan mérik a keresők találati oldalain, mit néznek az emberek. Ő a hirdetések szempontjából vizsgálja a kérdést, amihez szeretnék hozzátenni egy-két szempontot a találatok áttekinthetőségére vonatkozóan.

A tanulmányok azt erősítették meg, hogy az emberek nagy többsége valójában csak az első néhány találatot nézi meg, a többi gyakorlati szempontból a kereső számára láthatatlan. Milyen megoldást adhatnak erre a keresők?

Az egyik lehetséges út az ún. clustering vagy tartalomjegyzék, amikor a találatokból megpróbálják kinyerni a legfontosabb kifejezéseket. Ilyet alkalmaz a vivisimo Clusty keresője, illetve a magyar PolyMeta kereső, amelynek a fejlesztésében magam is részt veszek. A keresés után a tartalomjegyzék egy-egy elemére kattintva megtalálhatjuk az azt tartalmazó találatokat, még ha azok, akár a 4. oldal legalján is vannak a találatok között.

Milyen tartalomjegyzéket adnak például a "digitális fényképezőgép" kifejezésre (a baloldali a Clusty, a jobboldali a PolyMeta tartalomjegyzéke):

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Keressünk együtt 2 - Építsünk keresőt

2007.09.19. 21:44 Szerző: Kereso75 Címkék: wikia kollaboratív keresés grub

Van egy másik igéretesnek látszó kezdeményezés a területen a Grub.org, ami egy elosztott crawler.  Ha valaki feltelepíti a Grub programját a gépre, akkor az ő gépéről is futni fog egy program ami a web egy részét bejárja és az eredményeket feltölti a Grub adatbázisába. Annyiban más a megközelítés mint a korábban említett esetben, hogy itt központi index épül. Sokáig haldokolni látszott a Grub, míg az idén nyáron felkarolta a Wikia, akik a nyílt keresőjük részeként építenek a Grub projektre.

Négy alapelvet fogalmaznak meg arról milyennek is kell lennie a jövő internetes keresőjének:

1. Átlátható - Lehessen tudni, hogyan működik a rendszer, milyen algoritmusokra épül. Nyílt forráskód, nyílt tartalom.  

2. Közösség - Mindenki hozzájárulhat valamivel

3. Minőség - Jelentősen javítani találatok pontosságát és jobbá tenni a keresési élményt

4. Adatvédelem - Ne tároljunk semmilyen személyes, azonosítható adatot

Jogos felvetések, amelyek közül én elsősorban az elsőt tartom nagyon lényegesnek. Ki tudhatja valójában, hogy egy-egy találat miért pont oda rangsorolódik valamelyik üzleti keresőben? A keresők nagyon is fekete dobozként működnek. Persze ezzel lehet vitatkozni is, hiszen ha tudom a pontos rangsor képzési eljárást, akkor elvileg könnyebben előre is tudom juttatni a saját oldalamat.

Mindenesetre aki rögtön a tettek mezejére akar lépni, javaslom töltse is le a Grub crawlert és futtassa a gépén. Elég jól beállítható, hogy mennyi erőforrást (processzor és sávszélesség) engedünk használni. Ha letöltötted és futtatni akarod csatlakozz a Hungary csoporthoz. Egy tagja már van. :o)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

4 komment • Kövess Facebookon • Iratkozz fel értesítőre

Keressünk együtt - kollaboratív keresés

2007.09.18. 08:42 Szerző: Kereso75 Címkék: kollaboratív keresés faroo

A kollaboratív keresést említettem, mint egy több szakértő által emlegetett irányt. A TechCrunch konferencia első napján mutattak be többek között egy érdekes keresőt, ami ilyen megoldásra épül. A német FAROO hagyományos értelemben (crawler) nem járja be a webet, nem épít központi adatbázist, hanem a felhasználók által letöltött programmal monitorozza, hogy merre jár a felhasználó. Így az indexépítés és sorrendezés is P2P alapon működik az egyes felhasználók gépeit használva fel erre. A keresési eredmények sorrendjét az oldalak látogatásának népszerűsége határozza meg alapvetően.

A FAROO a hirdetési bevételeit is megosztja a felhasználókkal maximum 50 százalékos mértékben (mondjuk ez elég érdekes megoldás, mert ezzel gyakorlatilag érdekeltté válnak a felhasználók a hirdetésekre való kattintásban, ami viszont kérdésessé teszi a hirdetés hatékonyságát a hirdető szempontjából), és a hirdetések megjelenésében célzottan járnak el, amennyiben az adott felhasználót különösen érdeklő hirdetéseket igérnek. Érdekes koncepció, kérdés azonban, hogyan akadályozzák meg, hogy a nem túl minőségi, de látogatott oldalak (pl. szexoldalak. Ígérik, hogy valahogy védik a spamet...) hangsúlyt kapjanak. Mindenesetre beregisztráltam a kipróbálásra, és megfogom osztani a tapasztalataimat.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása