HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Elindult az iGlue szemantikus kereső

2009.11.12. 14:33 Szerző: siklosib Címkék: iglue szemantikus keresés

Elindult a magyar fejlesztésű iGlue tartalomszervező és kereső eszköz ingyenesen hozzáférhető verziója.

A szöveges tartalomban való keresés hagyományos megoldása a keresett kifejezést reprezentáló karaktersorozat felismerése. Ezzel szemben az iGlue nem szóalakokat azonosít, hanem azok jelentését. Így a keresett információt akkor is megtalálhatjuk, ha nem ugyanabban a formában szerepel.

Az iGlue keresője tehát egy ilyen alapokon megvalósított adatbázis, részletes keresési opciókkal. A tárolt információk között kereshetünk általánosan, melynek eredményeit kategóriákba rendezve kapjuk, vagy már kiindulásként szűkíthetjük a keresés hatókörét a számunkra érdekes kategóriára. A nagy részletességgel kidolgozott adatbázisnak köszönhetően egy-egy kategória tulajdonsága alapján is kereshetünk, kiválasztva akár, hogy az 1950-ben született, később Kossuth-díjjal kitüntetett személyeket, illetve hozzájuk kapcsolódó információkat szeretnénk megtalálni.

A szemantikai adatbázis jelenleg több mint 20 millió adatbejegyzést tartalmaz különböző formátumban tárolva, legyen az kép, video, személy, intézmény, weboldal, földrajzi hely, vagy bármilyen objektum, melyek között természetesen megjelennek a szemantikai kapcsolatok is. Az adatbázis egyelőre zárt, de hamarosan megnyílik, így mind emberi mind mesterséges intelligencia alkalmazásával, a weboldalakon található entitások és a közöttük lévő szemantikai kapcsolatok automatikus azonosításával folyamatosan bővülni fog, kiterjesztve a jelenlegi hiányos lefedettséget.

Ha nézegeted, feltétlenül vedd figyelembe:

A keresés az adatbázisban található entitásokra terjed ki (személyek, földrajzi helyek, intézmények, képek stb.).

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

5 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr371520254

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

BaluKapitany · http://profihonlapkeszites.hu 2009.11.15. 22:24:44

mire lesz ez jó egész pontosan?

mert arra, hogy "költő 1848" semmit nem adott elő... persze petőfi sándorra már sok mindent, de ez még eléggé gyér szerintem.

vang_so · http://www.iglue.hu 2009.11.16. 13:40:55

Kedves Captain!

Az egyik legfontosabb szempont, hogy itt alapvetően nem egy Gugli vagy Bing típusú általános webkeresőről van szó, mint inkább egy információszervező alkalmazásról. Leginkább a Wikipédiához lehetne hasonlítani, a fő különbség, hogy az információk itt nem szabadszöveges formában, hanem adatbázisba rendszerezve találhatóak és kereshetőek. Ha például a kategóriakeresőben foglalkozásként megadod, hogy „költő” a születési időnél hogy pl. „1800 és 1850 között”, a születési helynél pedig, hogy „Magyarország”, akkor 130 magyar költő jelenik meg, akik a 19 század első felében születtek. Ezek a szempontok pedig szabadon variálhatók (pl. amerikai elnökök, akik merényletben haltak meg stb.) Azaz az egyes elemekhez tartozó konkrét tulajdonságok szerint lehet keresni ill. szervezni a találatokat.

Az adatbázisban lévő induló adatmennyiséget (130 ezer ember, 2,5 millió földrajzi hely, 10 ezer intézmény) is innen érdemes megközelíteni. Gondoljunk vissza, a Wikipédia sem 2 millió szócikkel indult. Az adatok, tulajdonságok köre és mennyisége gépi és közösségi úton egyaránt bővíthető (kb. 2 hónapon belül élesedik a közösségi szerkesztési funkció). Alapvetően tehát nem egy késztermékről, hanem egy közösségi palántáról van szó, ami a felhasználói figyelemtől és részvételtől lesz remélhetőleg egyre nagyobb, szebb és okosabb :))

Hogy mi mindenre lehet jó, az reményeink szerint szinte csak a felhasználótól függ majd, lévén az a terv, hogy az általános jellegű informálódáson túl, ezekeből a kis infó-modulokból ki-ki saját érdeklődése, ízlése szerint építkezhessen. Azaz lehet majd belőle építeni óravázlatot, személyes naplót, szakmai életrajzot, prezentációt stb.
Alapvetően tehát nem linkcsokrot összeállító webkeresőről van szó, hanem egy kísérleti jellegű online információszervező alkalmazásról, aminek az adatbázis az első eleme és alapja, és a fejlesztés során egyre több eszköz kerül kifejlesztésre, ami segít az infókkal való legózásban.

Egy kis magyar csapat visszük a fejlesztést és minden felmerülő kérdést, ötletet, javaslatot nagyon szívesen látunk és amilyen gyorsan tudunk, reagálunk rájuk!
Nagyon bízunk benne, hogy az idő előrehaladtával egyre több örömet leltek majd az iGlue-val való játékban :))

Vaskó Péter (iGlue)

Nyaligátor · http://autostat.hu/technikai-szotar 2009.11.17. 13:56:22

Nem rossz ötlet, szerintem együtt használva egy guglival hasznos. Néha az is marhaságot ad, meg mindenre a wikit...

P.W. 2009.11.25. 11:47:09

Kedves Peter!

Elkepzelheto, hogy az iglue helyettesiteni fogja a guglit vagy -tekinteve, hogy teljesen mas a ket kereso elve- abszolut azt tervezitek, hogy alarendelt viszonyban lesz? Egyaltalan beszelhetunk-e alarendeltsegrol vagy inkabb a mellerendeltseg lenne a helyes kifejezes?
Gondolom az eddigi szurok szama bovulni fog. Ezzel kapcsolaban meg az lenne a kerdesem, hogy torrentekre lehet-e majd keresni a jovoben? Amennyiben igen, azt milyen formaban akarjatok megvalositani?Azert kerdezem, mert velemenyem szerint egy torrent kategoria illetve szuro nagyban novelne a userek szamat.
Ha pl. beirok a keresobe egy akarmilyen brand-et, akkor talalatkent megadja-e majd nekem az adott brand legfrissebb modelljeit vagy csak magarol a markarol tudok meg tobbet? Remelem egyertelmuen fogalmaztam. Koszonom a valaszt!
Sz

vang_so · http://www.iglue.hu 2009.11.30. 21:17:38

A guglit én úgy látom, mint egy nagy előszűrőt, linkmarkoló gépet, aminek kitermelt kupacaiban a userek szorgalmas régészekként még sok-sok keresést, túrást-fúrást, kutatást végeznek, hogy végül előállítsák a számukra szükséges információt.

A tudás-szerzésben a gugli egy hatékony és fontos eszköz. Ugyanakkor egy markoló persze nem alkalmas például villanyszerelésre vagy padlócsiszolásra. Ha például az a házi feladat, hogy Pistike keress 19. századi francia nőköltőket, akkor a gugli leginkább arra jó, hogy közel vigyen egy vagy több céladatbázishoz, információs ponthoz, ahol ez a kérdés pontosabban megfogalmazható, a téma feltárható, mivel a gugli természeténél fogva nem fog névsorral szolgálni.
A kiegészítő, mellérendelő viszony tehát jelenleg is létező gyakorlat.
Ami a a gugli-yahoo-bing-stb. között nagy csörömpöléssel a szemünk előtt jelenleg zajlik, az alapvetően és elsősorban a markológépek csatája. Ilyen helyre az ember természetesen nem nevez be forrasztópákával és tűreszelővel, pláne nem akarja vele elvégezni az exkavátorok munkáját.

Én úgy vélem a következő fontos lépés nem a gigatonnás linktömegekről fog szólni (önnek 23,4 millió találata van). Inkább arról, hogyan lehet feldolgozni úgy ezt a böhöm tömegű nyers ércet, hogy abból a végére csinos, jól szervezett kisautó, krumplinyomó, részecskegyorsító, azaz jóvágású információ kerekedjen.
A guglival a saját funkcióiban harcolni olyan, mintha valaki szkanderban próbálná lenyomni a floridai Terminátort. Az ő pályájuk és szabályaik helyett inkább egy olyan ügyességi sportot próbálunk létrehozni, amit mi jobban élvezünk, és reméljük, velünk együtt még sokan (és persze amiben mi lehetünk a legjobbak :))

Az út pedig éppen az, amit írtál is: a különféle kapcsolati típusok szélesítése, finomítása, okosítása. Most dolgozunk egy olyan modulon, amivel a weblapok szövegéhez lehet lehet hozzárendelni az adatbázis elemeit, mintegy röptében tagelni vwlük az oldalakat, első lépcsőben kézzel, majd később a géppel felismertetni a szövegben előforduló konkrét személyeket, helyeket, intézményeket stb.

Összefoglalva: nem egy gugli-funkciókat utánzó általános keresőt építünk, hanem egy új lehetőségeket teremtő tudás-szervező eszközt, amivel még épp csak megkezdődött a kísérletezés, hogy mi mindenre is lehet alkalmas. Az általad írt ötletek nagyon jók, és másokat is arra bíztatnánk, hogy mondják el, nekik mi hiányzik a jelenleg elrhető eszközökből, amit szívesen látnának, vagy kipróbálnának a jövő online programjaiban.
süti beállítások módosítása