HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Főbb témák

adatbányászat (6) adatok (12) adatújságírás (16) adatvizualizáció (17) AI (14) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (48) bing (14) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (15) google (57) Google (23) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (57) kereséselmélet (7) keresés jövője (54) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (6) LDA (10) lda (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (12) metafora (7) mobil (37) mobil keresés (17) Neticle (8) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (28) nyelvtechnológia (73) open data (11) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (47) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (18) szemantikus kereső (9) szentimentelemzés (34) szövegbányászat (15) társadalomtudomány (7) tartalomelemzés (54) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) twitter (15) Twitter (18) vertikális kereső (9) vizualizáció (12) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Keressünk együtt 2 - Építsünk keresőt

2007.09.19. 21:44 Szerző: kereso Címkék: wikia kollaboratív keresés grub

Van egy másik igéretesnek látszó kezdeményezés a területen a Grub.org, ami egy elosztott crawler.  Ha valaki feltelepíti a Grub programját a gépre, akkor az ő gépéről is futni fog egy program ami a web egy részét bejárja és az eredményeket feltölti a Grub adatbázisába. Annyiban más a megközelítés mint a korábban említett esetben, hogy itt központi index épül. Sokáig haldokolni látszott a Grub, míg az idén nyáron felkarolta a Wikia, akik a nyílt keresőjük részeként építenek a Grub projektre.

Négy alapelvet fogalmaznak meg arról milyennek is kell lennie a jövő internetes keresőjének:

1. Átlátható - Lehessen tudni, hogyan működik a rendszer, milyen algoritmusokra épül. Nyílt forráskód, nyílt tartalom.  

2. Közösség - Mindenki hozzájárulhat valamivel

3. Minőség - Jelentősen javítani találatok pontosságát és jobbá tenni a keresési élményt

4. Adatvédelem - Ne tároljunk semmilyen személyes, azonosítható adatot

Jogos felvetések, amelyek közül én elsősorban az elsőt tartom nagyon lényegesnek. Ki tudhatja valójában, hogy egy-egy találat miért pont oda rangsorolódik valamelyik üzleti keresőben? A keresők nagyon is fekete dobozként működnek. Persze ezzel lehet vitatkozni is, hiszen ha tudom a pontos rangsor képzési eljárást, akkor elvileg könnyebben előre is tudom juttatni a saját oldalamat.

Mindenesetre aki rögtön a tettek mezejére akar lépni, javaslom töltse is le a Grub crawlert és futtassa a gépén. Elég jól beállítható, hogy mennyi erőforrást (processzor és sávszélesség) engedünk használni. Ha letöltötted és futtatni akarod csatlakozz a Hungary csoporthoz. Egy tagja már van. :o)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

4 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr31170792

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

mosquito · http://www.seoblog.hu 2007.09.20. 10:10:48

en hajlok abba az iranyba, h jobb ez igy, h fekete dobozkent mukodnek. meg igy is lehet oket manipulalni kicsit, hat meg akkor mi lenne ha full publikusak lennenek az algoritmusok. szeretnek hinni abban, h tudna mukodni, de naiv nem vagyok, ez egy szemet vilag, a marketing pedig nem az etikussagarol hires szakma, es gyanitom, h ennel meg csak rosszabb lesz a helyzet.

kereso · http://kereses.blog.hu 2007.09.20. 12:59:14

Valóban lehetnek hátrányai is a nyílt megoldásnak, ahogy már én is jeleztem a cikkben, de hosszútávon biztos, hogy nem szül jót, ha valami kvázi monopóliumként működik. Az információk elérésének szabadsága korlátozható vele például. Gondolj csak a Google kínai esetére, amikor bizonyos oldalak megjelenését letiltották az indexükből, mondván arra egy kínai a cenzúra miatt úgy sem tud majd kattintani.

AlBrown · http://www.netkezdo.hu 2007.09.20. 13:05:17

Már 2 tagja van a Hugary csoportnak. :)
A kezdeményezés nagyon tetszik, de még rettentően gyerekcipősnek tűnik a dolog. A kliens szépen muzsikál, de a webes felületük, még igen kezdetleges. Most pl MySql hibákat dobál egyfolytában, keresni éppen nem lehet. Kiváncsi vagyok mi fog kisülni ebből, én drukkolok.

Egészen addig, amig nem 100% ban hibátlan egy népszerű kereső addig, jobb ha fekete dobozként működik :) Ha létezne a "tökéletes" algoritmus, azt akkor sem lehetne manipulálni ha ismerük a működését. Valószínűleg ilyen sosem lesz :)

aziro 2007.09.21. 23:25:52

Csatlakoztam én is a csapathoz, a szabad kapacitását a gépeimnek feláldozom. Lássuk mi sül ki belőle.