HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A hazai fejlesztésű iGlue demo kipróbálható

2008.07.29. 12:12 Szerző: Kereso75 Címkék: szemantikus kereső

Ma a keresés, tartalomfeldolgozás egyik kurrens iránya, hogy szemantikus informácókkal próbáljuk ellátni, akár utólag az elérhető tartalmakat. Erre egy remek hazai fejlesztés is akad, mégpedig az iGlue.

Vaskó Péter írta:

"Megjelent a hazai fejlesztésű szemantikus tartalomszervező és kereső, az iGlue első demója, ill. elindult az iGlue blog. Magyar nyelven az www.iglue.hu, angolul a www.iglueit.com címen érhető el.

Ebben a demóban a külső oldalak annotálására és az iGlue helyben megjelenő infodobozára (Icecube) koncentráltunk. Hamarosan kipróbálható állapotba kerül a szemantikus alapokra épülő, kollaboratív adatfelvitelt és szerkesztés lehetővé tévő adatbázis is, amelyből az infodoboz az adatokat nyeri.

A demó során egy New York Times cikk feldolgozását láthatjuk. A jobb felső sarokban levő zöld gombot egyszer lenyomva, kiemelésre kerülnek a névként (tulajdonnév, földrajzi hely stb.) értékelhető szövegrészletek. Újabb kattintás után pedig feljön egy különálló ablak, ahol az egyes szavakról tudhatunk meg többet, igen látványos keretek között.

A kereséshez úgy kapcsolódik a hír, hogy nyilván nagy pluszt jelenthetne egy kereső esetében, ha bizonyos fogalmak között kapcsolatot tudna teremteni. Például egy ilyen összefüggés egy személy és annak születési dátuma. Jelenleg a webes keresés nagyban hasonlít a tű keresésére abban a bizonyos szalmakazalban, ahol ugyan van valamilyen összefüggés bizonyos szalmaszálak között (linkek), de hogy ezek valójában milyen tartalmi, jelentésbeli összefüggést hordoznak nem tudhatunk bizonyosat. A szemantikus címkéző, összefüggés kereső szoftverek a szalmaszálak elrendezésére, összekapcsolására tesznek kísérletet. Kíváncsian várom a további fejleményeket!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

5 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr40590818

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

LA 2008.07.30. 21:13:10

Vegre magyarul is beindult. Mit tud az iGlue a TAO (www.tao-project.eu/) SEKT (www.sekt-project.com/) es Ontogen (ontogen.ijs.si/) haromszogben?
Koszonom,
LA

jendre · http://kereses.blog.hu 2008.07.30. 23:46:48

És hozzátennék még egyet: Reuter OpenCalais www.opencalais.com/
Bevallom, hogy még én is csak inkább ismerkedek a témával, és nem ismerem olyan mélységben, hogy megítélhetném. A kérdést eljuttatom a szerzőkhöz.

Vaskó Péter · http://www.in4.hu 2008.07.31. 00:05:08

Kedves LA,
ahogy Endre helyesen mondja, az iGlue annotációs technikája leginkább az Open Calais-nál használt eljárásra hajaz (amelyet leánykorában még Clear Forestnek hívtak). Szintaktikai és szemantikai elemzéssel jó közelítéssel meg lehet határozni (kb. 70-80% közötti pontosság érhető el), hogy egy adott nyelvi elem egy háttéradatbázis melyik elemének felel meg.
Hasonló technikát alkalmazó cég még pl. a Lingospot (www.lingospot.com).

Az adatbázis elemkészletének kapcsolata, struktúrája, azután már igen sokféle lehet, és számos szervezőelv segítheti az adatkapcsolatok (és így az eredmény) konzisztenciájának, relevanciájának biztosítását. Ilyen jellegű adatbázis épít például az Opencyc vagy a Freebase. A kapcsolati struktúra mögött állhat általános szerkezetű ontológia, valamiféle taxonómia, tezaurusz vagy szimpla tagelés, azaz folkszonómia (mint pl. a Delicious vagy Spock esetében), esetleg ezek valamilyen ötvözete.

Az iGlue abban próbál előrelépni, hogy a kétféle megközelítést (nevezik top-down, ill. bottom-up módszernek is őket) egymásra vetítve, egymást erősítve használja. Ha követitek a www.iglue.hu blogot nemsokára erről is írunk posztot!

LA 2008.07.31. 07:07:22

Kedves Vaskó Péter! Tehát: ha szörfölök a neten, érdekődöm, kívácsiskodom, akkor nagyszerű az iglue. Mitől jó az iglue akkor ha keresek? Hogyan segít a kérdésfeltevés élesítésben? Csak annyit tudok, hogy "valószínűleg van válasz a kérdésemre". Hogyan használjam az iglue-t? LA

Vaskó Péter · http://www.in4.hu 2008.07.31. 12:37:00

Kedves LA,
ez alapvetően implementációs kérdés. Az iGlue nem általános célú kereső, mint mondjuk a Google, tévedés lenne azzal összevetni. Inkább a másik fő online információs forráshoz, a Wikipédiához hasonlít, csak annál sokkal komplexebb és konzisztensebb adatkapcsolati hálóval. Alapvetően nem szócikkek, hanem elemi adatok kapcsolatára épít. Filozófiában, megközelítésben jelenleg a Freebase (www.freebase.com) áll hozzá a legközelebb.

A Wikipédiához vagy Freebase-hez hasonlóan magában az iGlue adatbázisában is lehet majd közvetlenül keresni, és az adatbázis kollaboratívan szerkeszthető lesz. Persze a program képességei és az adatkapcsolati háló az általános keresésben is hasznosíthatóak, főként a disambiguálás során (azonos alakú, de eltérő jelentésű szavak megkülönböztetése, tárgyalunk is néhány céggel ezzel kapcsolatban). Azaz segíthet megállapítani, hogy egy adott szövegben az Apple szó éppen gyümölcsöt vagy szoftvercéget jelent-e.

Emellett egy olyan modulon is dolgozunk, amely nem egyszerűen karaktereket, hanem konkrét jelentéseket, fogalmi kapcsolatokat is képes feltárni a természetes nyelvű online szövegekben, amely adatokkal reményeink szerint a program öntanuló módon lesz képes bővíteni saját adatbázisát. Mindez természetesen hosszú távú terv, jelenleg az adatkapcsolati háló alapjait igyekszünk úgy kialakítani, hogy mindezen céloknak meg tudjon felelni.
süti beállítások módosítása