HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Beszélj a drónodhoz!

2014.04.21. 16:59 Szerző: Zoltán Varjú Címkék: nyelvfilozófia nyelvtechnológia drónok funkcionális programozás

Szeretnénk beszélni a gépekhez. Még jobban szeretnénk, ha meg értenének minket. Szeretnénk, ha megértenék céljainkat, vágyainkat és azoknak megfelelően cselekednének. Eközben persze nem akarunk nekik részletesen elmagyarázni mindent. Szeretjük, ha a "olyan meleg van itt a szobában" típusú megnyilatkozásaink után valaki megkérdezi udvariasan hogy "ne nyissuk ki az ablakot", vagy ne is kérdezzen, hanem egyből nyissa ki az ablakot. Álom? Carin Meier azon dolgozik, hogy ez valóra is válhasson!

 

(Aki egy kicsit jobban szeretne elmélyülni a technikai részletekben, az nézze meg ezt, a sajnos nem beágyazható videót is!) Meier gondolt egy nagyot és visszanyúlt a mesterséges intelligencia születésének idején megfogalmazott ötletekhez; mi lenne, ha egy Lisp nyelvben implementálhatná az ún. beszédaktusok elméletére alapozott Elephant nyelvet? 

lisplogo_fancy_256.png

A Lisp a második legöregebb programozási nyelv. John McCarthy gyermeke, akinek az az ötlete támadt, hogy Church lambda kalkulusában akart programozni. Hogy miért? Mert a egy számítástudósnak ez sokkal intuitívabb! Mielőtt valaki kételkedni kezd, érdemes Paul Graham, az Y combinator startup program elindítójának Beating the Averages és What Made Lisp Different c. esszéit elolvasni - a többieknek legyen elég annyi, hogy a mesterséges intelligencia nyelve a Lisp. A modern irányzatok pedig ennek egy új változatát, a Clojure-t használják.

mccarthy4_300.jpg

John McCarthy több tanulmányában is amellett érvelt, hogy a valódi mesterséges intelligenciának kezdenie kell valamit avval, hogy az embereket hitek, célok és meggyőződések (is) mozgatják. Nem kell minden gépnek kifinomult meggyőződések rendszerével rendelkezni és nem kellenek nekik nagy célok sem. Egy termosztátnak legyen az a célja, hogy a szoba megfelelő hőmérsékletű legyen, és legyen információja arról, hogy adott pillanatban éppen megfelelő, hideg, vagy éppen meleg-e a helyiség.

speechacts.jpg

McCarthy John R. Searl beszédaktus-elméletéből merített ihletet. A nyelvfilozófia a múlt század közepétől egyre inkább az ún. hétköznapi nyelv felé fordult. A beszédaktus-elméletet a nyelvi viselkedés izgatja, hiszen amikor mondunk valamit, akkor nem csak egy állítást teszünk, hanem egyben cselekvést is végrehajtunk. Pl. amikor a bíró kimondja hogy "öt év letöltendő fegyházra ítélem" vagy amikor az anyakönyvvezető szájából elhangzik hogy "házastársnak nyilvánítom önöket", akkor nem csak állítások kerülnek kimondásra, hanem egyben cselekvések, aktusok hajtódnak végre. Ezen aktusok megértéséhez rendelkeznünk kell közös hitekkel és célokkal - másképp könnyen mondhatjuk, hogy  a házasság érvénytelen pl. mert az egyik fél kiskorú volt és nem fogta fel mi is történik vele stb.

 

Meier zseniális hobbi projektje McCarthy álmát valósítja meg egy a beszédaktus-elméletre alapozott robot nyelvvel. Érdemes megjegyezni, hogy ez a nyelv nem csupán az ember-gép, hanem a gép-gép kommunikációt is segíti! Egy Roomba porszívó és egy drón táncának lehetnek tanúi azok akik végignézik a fenti videót!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A rút kiskacsa meg az ingyen ebéd

2014.04.18. 08:42 Szerző: Zoltán Varjú Címkék: gépi tanulás

Manapság mindenki azt hiszi, hogy ha van adata, akkor majd valamilyen gépi tanulás csoda segít majd megoldani a problémáit - sőt, az egész világ szebb, jobb és úgy általában egy élhetőbb hely lesz. Persze mi is imádjuk ha van adat és lehet rajta dolgozni. Két dolgot azonban nem árt észben tartani!

No-free-lunch.png

1. Az ún. No Free Lunch Theorem (vagy inkább Theorems) rámutat arra, hogy nincs univerzálisan jól működő eljárás, ergo meg se próbáljunk automatikusan módszert választani egy előttünk álló feladathoz.

The_Ugly_Duckling_(1939_film)_poster.jpg

2. Az Ugly Duckling Theorem remek példa arra, hogy a gépek azt csinálják amit mondunk nekik, az eredményekhez kell az emberi intuíció. Magyarán ahhoz, hogy egy klasszifikáció működjön, bizony valamilyen részrehajlást be kell vinnünk az eljárásba, máskülönben nem működhet a dolog! (Aki nem hiszi, kattintson a linkre!!!!!)

 

Magyarán szükség van szakértőkre és foglalkozni kell a problémáinkkal, nem elég ülni az adatokon és várni hogy valaki előáll majd egy gépi tanulás algoritmussal, ami mindent megold!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Making Sense of Data - Google MOOC kurzus

2014.04.17. 08:00 Szerző: Zoltán Varjú Címkék: kurzus Google MOOC data science

Minden az adatokról szól manapság! Ha valaki szeretné érteni, hogy miért, továbbá szeretné is használni az adatokat (legyenek azok sajátjai, vagy nyílt adatok), akkor a Google ingyenes online kurzusa a Making Sense of Data legjobb választás!

 

A kurzus nem igényel különösebb előképzettséget és egy laptopon és működő internetkapcsolaton kívül nem kell más az elvégzéséhez - vagy mégis, egy Google fiók azért nem árt :D A kurzus elvégzése után nem lesz az emberből egyből data scientist, de az alapokkal tisztába kerülhet és megtanulja kezelni a Google Fusion Tables-t. Csak ajánlani tudjuk ezt a remek kis kurzust!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Az angol bizony nem elég!

2014.04.15. 09:54 Szerző: Zoltán Varjú Címkék: nyelvek nyelvtechnológia

Ma már minden angolul van! Aki nem tud angolul, az nem is létezik! Nem érdemes foglalkozni más nyelvekkel, ami számít az úgyis meg fog jelenni angolul! Az előbbi mondatok nem képezik hivatalos álláspontunkat, csupán az utóbbi időkben egyre gyakrabban hallunk ehhez hasonló kijelentéseket - és akik így vélekednek azok TÉVEDNEK! Nem csak a szép bölcsész lelkünk mondatja ezt velünk, hanem a rideg gazdasági racionalitás is.

arabic_cloud.jpg

Habár nem szeretünk az angol (és esetleg anyanyelvünk) mellett más nyelvekkel próbálkozni, általánosan elterjedt siránkozni amiatt, hogy telített a piac. A válság után még mindig nehéz kinyitni a megrendelők pénztárcáját is. Érdemes megnézni, hol van most tartós növekedés! A pénzügyi világban elterjedt mozaikszavak, mint a BRIC (Brazília, Oroszország, India, Kína), BRIMC (Mexikót takarja az M), BIRCA (ahol az A az arab országokat jelöli) ill. a BRICET (az E kelet-európa, a T pedig Törökország) jelzik merre érdemes nézelődni. 2001 és 2011 között ezen országok nyelvein megjelenő netes tartalmak száma hihetetlen mértékben növekedett!

the growth in English usage online stands at just over 281% over the past decade – far less than Spanish (743%), Chinese (1,277%), Russian (1,826%) or Arabic (showing a massive growth of 2,501% over the same period). [forrás]

Ezek bizony nem kicsi nyelvek, rajta vannak a tíz legnagyobb nyelv listáján, de jelenleg "alig" használják őket az interneten. A kínait a világ lakosságának kb. 14.4 százaléka beszéli, az internetes tartalmak terén az aránya viszont csupán 3.3%. Az arab nyelv különféle változatait kb. 300 millióan beszélik mint első nyelv és összesen 450 millióan értik, ami több mint az emberiség 4%-a, de weboldalak kb. 0.8%-a érhető el arabul. (Az érdeklődő olvasó figyelmébe ajánljuk az Ethnologue statisztikáit a világ nyelveiről és a Wikipedia szócikkét az internetes arányukról.) A globalizáció ellenére, ahogy erősödik ezen országok gazdasága, egyre többen anyanyelvükön kezdik használni az internetet. Nekik pedig előbb, vagy utóbb szükségük lesz nyelvtechnológiai megoldásokra...

 

Jelenleg a feljövőben lévő nyelvekkel leginkább a kormányzati és pénzügyi elemzéseket végző kutatók foglalkoznak. A Twitter forradalmak kutatása, a társadalmi változások közösségi média elemzéssel történő előrejelzése, vagy a hírelemzés a nyugati világ mániája még manapság. De érdemes elgondolkodni azon, hogy ezen a területen növekedés és biztos kereslet mutatkozik és valószínűleg ez még sokáig így is marad!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Szemantikai-pragmatikai konferencia Szegeden

2014.04.08. 10:42 Szerző: annapetra Címkék: konferencia szemantika pragmatika

A Szegedi Tudományegyetem Általános Nyelvészeti Tanszéke és a Pragmatika Centrum Országos Kutatóközpont konferenciasorozatot indít Újdonságok a szemantikai és pragmatikai kutatásokban címmel.

54958288.jpg

 


A konferencia időpontja 2014. április 11., helye pedig a Szegedi Tudományegyetem Bölcsészettudományi Karának (Szeged, Egyetem u. 2.) Kari Konferenciaterme. A konferencia szervezői Maleczki Márta, Németh T. Enikő és Szécsényi Tibor.

A konferencián résztvevők hallhatnak érdekességeket az átokhasználat pragmatikájáról, illetve megtudhatják, meddig is ér a nganaszan takaró.

A konferencia előadásai alapján beküldött tanulmányok a Jelentés és nyelvhasználat címmel indítandó új elektronikus folyóiratban fognak megjelenni.

A konferenciára előzetes regisztráció nem szükséges.
Az esemény facebook oldala itt érhető el.

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása