HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Politika a sorok között - előadunk politikai témájú projektjeinkről

2015.11.16. 10:29 Szerző: Kitti Balogh Címkék: gyűlöletbeszéd politikai blogok szentimentelemzés emócióelemzés lda főpolgármester választás

Ma Dessewffy Tibor Politikai kommunikáció c. kurzusán adunk elő az ELTE Társadalomtudományi Karon.

A diákoknak bemutatjuk a szövegbányászat és a hagyományos szövegelemzés eltéréseit és ismertetjük pár politikai témájú projektünket:

  • a tavalyi főpolgármester-választáskor végzett emóció- és szentimentelemzésünket, amelyet a választási eredmények előrejelzésére használtunk fel,
  • a kuruc.info-n végzett romareprezentációs kutatásunkat, amely során topik modellel (LDA) nyertük ki a romaellenes témákat,
  • és a magyar politikai blogszférán végzett hálózat- és emócióelemzésünket.

Az előadás diái:

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Precognox @ KConnect Hackathon, Sheffield

2015.11.12. 11:38 Szerző: Zoltán Varjú Címkék: Precognox hackathon KConnect GATE

A KConnect projekt keretében a University of Sheffield NLP Group által szervezett hackathonon veszünk éppen részt. A két nap során a magyar és svéd nyelvű erőforrások GATE-be történő integrálását kezdtük meg és sokat haladtunk, pedig megjártuk a Don-kanyart is. A KConnect szolgáltatásai hamarosan elérhetőek lesznek magyar és svéd nyelvre is!

gate.png

img_20151111_164634.jpg

img_20151111_173033.jpg

20151111_173114_1.jpg

img_20151111_191638.jpg

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Szövegvizualizációk a szófelhőkön túl - Precognox @ MOME TechTea

2015.11.11. 10:37 Szerző: Zoltán Varjú Címkék: konferencia baba politikai blogok tartalomelemzés networkelemzés techtea szövegvizualizáció

November 18-án a MOME Tech Lab TechTea rendezvénysorozatán adunk elő. Csapatunk kiegészül Szűcs Krisztával, akivel korábban már dolgoztunk együtt

 techtea_1920x1080.jpg

A mai információs társadalomban az emberi agy számára feldolgozhatatlan mennyiségű információ áraszt el minket. Az információ mennyisége pedig csak egyre növekszik az infokommunikációs technológiák fejlődésével. Ezen információk nagy részével szöveges formában találkozunk, például Facebookon végigolvassuk ismerőseink posztjait, ellátogatunk az általunk kedvelt híroldalakra, beleolvasunk pár cikkbe, felkeressük a számunkra fontos szakmai oldalakat, majd estig megismételjük az eljárást párszor. Hiába a sok információ, még így is sokszor lemaradunk a lényegről. Hogy kinyerhessük a minket érdeklő információkat, rengeteg módszer kínálkozik a számítógépes szövegfeldolgozás területén. Azonban az így kinyert lényegi információk csak úgy érnek célt, ha azokat az emberek számára is emészthető formába közöljük, ezért az adatok vizualizációja és a felhasználói felületek megfelelő designja igen fontos lépés ebben a folyamatban.

Az előadás során a Precognox szövegfeldolgozási, szövegbányászati projektjeit mutatja be, melyek témái között szerepel az olvasási nehézségekkel küzdők támogatása, a romák elleni gyűlöletbeszéd, a magyar politikai blogszféra diskurzusa és a gyermekek nyelvfejlődése. A cég adatvizualizáció, interface és interakció design területen keres együttműködő partnereket pályázatokhoz, valamint gyakornoki programukban szívesen várnak a területek iránt érdeklődő diákokat.



Ha túl sok a szöveg - topik vizualizáció

Hogyan tudunk nagy mennyiségű szöveges információt könnyen és gyorsan áttekinteni anélkül, hogy elolvasnánk őket? Hogyan tudjuk akár az időben is követni, hogy a szövegek témái hogyan változnak? Projektünkben a látens Dirichlet allokáció (LDA) módszert vetettük be, ami humán kiértékelők szerint is természetes témákba rendezi a szövegek gyűjteményét. A témák kinyerését egy szélsőjobboldali hírportál 10.000 cikkén illusztrálva mutatjuk be, majd a témák időbeli áttekinthetőségét szolgáló adatvizualizáció tervezésének folyamatát ismertetjük Szűcs Krisztina segítségével, hogy hogyan alakítottuk ki a nyers adatból a végső interaktív vizuális ábrázolást.

 

Egymásba gabalyodva - a magyar politikai blogszféra az érzelmek hálójában

Az egyes szövegek sosem állnak önmagukban, beszélnek egymással hivatkozásokon és utalásokon keresztül. Az interneten ez egész explicit módon linkek formájában jelenik meg ami kirajzolja a hivatkozások hálózatát. Politikai blogokat vizsgáló projektünk keretében több mint 700 oldal posztjait és cikkeit gyűjtöttük össze, megvizsgáltuk a közöttük lévő kapcsolatokat. Mennyire pozitív, vagy éppen negatív egy oldal? A blogokon vagy a hírodalakon megjelenő szövegekben találhatunk a hat alapvető emberi érzelemre utaló szavakból többet? Projektünk során igyekeztünk a hálózati struktúrán is megjeleníteni az érzelmeket.

 

Sok beszédnek sok az alja - kulcsszókinyerés és kivonatolás

Nem  csak az egymásra hivatkozó szövegek alkotnak hálózatokat, egy-egy szöveg maga is felfogható az azt alkotó szavak hálózataként. A hálózati ábrázolás amellett, hogy a szófelhők alternatívája is lehet, alkalmas arra, hogy azonosítsuk a szöveg “központi” szavait. A fontos csomópontok azonosításával rövid kivonatot készíthetünk a szövegből, továbbá sok keresési feladatban hasznosnak bizonyult kulcsszavakat is kinyerhetünk.

 

A kulcsszavaktól a nyelvfejlődésig meg annak zavarai

Tudunk-e segíteni az olvasási nehézségekkel küzdőknek abban, hogy az online világ egyenrangú részesei lehessenek? A CHILDES gyermeknyelvi korpusz adatait vizsgálva a nemzetközi irodalom és saját vizsgálataink is azt mutatják, hogy a hálózati modellek jól írják le nyelvfejlődést. Érdekes kapcsolódás, hogy az olvasási nehézségekkel élők számára sokat segít a szövegértésben a kulcsszavak kiemelése. Saját kulcsszókinyerő alkalmazásunkat ezen a területen szeretnénk bevetni; egy olyan böngésző plug-in kifejlesztését tervezzük, ami a webes szövegeket sokkal emészthetőbb formátumban, a kulcsszavakat kiemelve jeleníti meg.



Előadók:

 

Szűcs Krisztina tervezőgrafikus, Data Visualization Designer krisztinaszucs.com

Balogh Kitti a Precognox statisztikusa

Varjú Zoltán a Precognox számítógépes nyelvésze


A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data szoftvermegoldások kutatója és fejlesztője.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Tánc, kiterjesztett elme és mesterséges intelligencia

2015.11.05. 14:53 Szerző: Zoltán Varjú Címkék: tánc mesterséges intelligencia diszlexia elmefilozófia kiterjesztett elme

Szeretnénk azt hinni, hogy az elme az agyban lakozik. Önmagában az agy modellezése is eléggé nehéz feladat, de ha sikerül részben megoldani, akkor van egy intelligens rendszerünk. De mennyire intelligens egy rendszer, ami egy feladatra fókuszál? Szétszálazhatjuk-e az agy területeit önálló modulokra? Az a tény, hogy az elme látszólag egymással semmilyen kapcsolatban nem álló funkciói hatnak egymásra, nem sok jót ígér. Tovább bonyolítja a helyzetet, hogy az elme egy testbe van ágyazva és szereti magát kiterjeszteni az őt körülvevő környezetbe, azaz tulajdonosa testét és az azon kívüli világot is használja. A tánc pedig segít belelátni ebbe a kusza helyzetbe!

giphy.gif

Korábbi posztunkban már megemlítettük Goldin-Meadow kísérleteit, melyek nagyon ötletesen mutatnak rá arra, hogy gesztusainkkal egyben gondolkodunk is.

Peter Lovatt, más néven Dr. Dance, egykori táncos, aki imádott művészetét használva küzdött meg olvasási nehézségeivel és lett a tánc pszichológiájának elismert kutatója. Lovatt többek között arra hívja fel a figyelmet, hogy a tánc és úgy általában a valamennyire strukturált mozgás a gondolkodásban is segít. De hogy lehetséges ez?

Alva Noe a megtestesült (embodied) gondolkodás irányzatának legkreatívabb filosza szerint egyszerűen fel kell adnunk azt a karteziánus képzetet, mely szerint az elme elválasztható többi részünktől, vagy kiragadható a környezetéből. Nem csak arról van szó, hogy az elme aktívan használja a környezetét, hanem hogy az elme, a test és a környezet egyszerre adott, nem igazán lehet őket elkülöníteni. A tánc Noe számára azért izgalmas, mert reflektál arra, ahogyan egy elmével rendelkező test interakcióba lép a környezetével.

De miért olyan érdekes dolog ez a tánc? Noe a mesterséges intelligencia Dreyfus-féle, fenomenológiai kritikáját adja (erről bővebben már írtunk itt), ami pontosan arra világít rá, hogy a tudományos módszer képtelen megragadni azt a totalitás élményt, ahogy az elme, a test és a környezet egyszerre, dinamikusan alakítja életünket. Az intelligencia része, hogy ebben a dinamikus viszonyban veszünk részt, életünk ezen részére pedig sokkal inkább a művészetekben és a humán tudományokban próbálunk reflektálni.

Dreyfus, Noe és a többi elmefilozófus nem hánynak fittyet a mesterséges intelligencia és a gépi tanulás sikereire. Nem kérdőjelezik meg az elért eredményeket és nem vonják kétségbe azt, hogy jelentős áttörések várhatóak ezen a területen. Gondolataik arra hívják fel a figyelmet, hogy ha integrálni akarjuk az egyes területeken jól teljesítő intelligens rendszereket, akkor szembesülnünk kell azzal, hogy nem csupán input-output problémával állunk szemben. A művészetek, pl. a tánc tanulmányozása nem csupán a bevett tudományos szemlélet kritikáját adhatja! Az olyan projektek, mint pl. a AI_am (melynek nagyon jelentős magyar vonatkozásai is vannak!) segítenek feltérképezni azt, hogy mi adható át, mi formalizálható abból a tapasztalatból a gépek számára, amit mi nap, mint nap megélünk, ahogy elménk, testünk és környezetünk interakcióba lépnek egymással.

Ne áruljunk petrezselymet, kezdődjön a tánc!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Beszélünk az érzelmeinkről - OSINT diák

2015.11.04. 12:00 Szerző: Zoltán Varjú Címkék: konferencia tartalomelemzés hálózatelemzés OSINT emócióelemzés

Az idei OSINT konferencián két előadással veszünk részt, ezek diáit alább közöljük.

 

Kapcsolódó posztjainkból többet is megtudhat a kedves olvasó a területről:

  • Politikai blogokkal foglalkozó projektünkről sokat írtunk, a tag linkjérőlelérhető az összes poszt
  • Az emócióelemzésről is sokat írtunk, ezen posztok innen érhetőek el könnyen

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása