HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Deep Learning mobilon - SwiftKey Neural Alpha

2015.10.12. 09:44 Szerző: Zoltán Varjú Címkék: mobil deep learning SwiftKey nyelvmodellek

Amíg mások csak beszélnek arról, hogy a deep learning a jövő még a mobilokon is, meg hogy újra kell gondolni az ember-gép interakciót, addig a SwiftKey kiadta mobil billentyűzetének új változatát, melynek motorja egy neurális háló.

slsim.jpg

A Neural Alpha jelenleg csak angol nyelvre érhető el. A "hagyományos" SwiftKey keyboarddal ellentétben nem ngram modellen alapul, hanem deep neural net model-t használ. A megközelítés előnye, hogy nem pusztán statisztikai alapon képes a következő elem megtippelésére, hanem az adott kontextust is figyelembe veszi. Saját tapasztalatunk szerint nem véletlenül Alpha státuszú még az app; nagyon könnyű volt olyan példát találni (egy cikk a The Economist-ból), amin nem boldogult jól.

 

Ugyanazon a szövegen a "hagyományos" billentyűzet egy kicsit gyorsabbnak bizonyult, ellenben a többnyelvűség miatt sokszor magyar ajánlatokat adott, továbbá a szövegben maradt egy typo!

 

Összességében elmondható, hogy a Neural Alpha nagyon ígéretes. Talán egy picivel lassabb mint elődje és fájóan egynyelvű, azonban ha nem újságcikket akarunk begépelni vele, hanem hétköznapi helyzetekben használjuk (email írás, chatelés, tweetelés, stb.), akkor nagyon kényelmes és gyors gépelést tesz lehetővé.

 

Úgy tűnik itt az ideje átismételni amit a neural network language modellekről tudnunk kell!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A Precognox az Adatozz okosan hackathonon

2015.10.07. 08:25 Szerző: Zoltán Varjú Címkék: Mókus Precognox hackathon K-Monitor Adatozz okosan Születésház

Idén immár másodszor került megrendezésre hackathon a K-Monitor Adatozz okosan programjának keretében, amin munkatársaink mint mentorok vettek részt és ismét precognoxos által mentorált csapat nyerte a versenyt. 

adatozz.jpg

A Születésház Egyesület első helyezést ért el, a csapat tagjai; Schmidt Erika, Hudy Róbert, és  Balogh Kitti kollégánk. Gratulálunk!

 

A K-Monitortól Koncsik Anitát Varjú Zoltán kollégánk segítette. 

 Kaptunk egy szép oklevelet is a részvételért :D

img_20151006_170007.jpg

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Deep learning - mit olvassunk?

2015.10.01. 13:31 Szerző: Zoltán Varjú Címkék: könyvajánló deep learning

Mik azok a  neurális hálózatok, hogyan tanulnak meg mitől deep a deep learning? Nehéz kérdések ez, főleg ingyenes forrásokat ajánlunk megválaszolásukhoz.

neural-network-aficionados-ersatz-event-brain-graphic-1140x440-1140x440.jpg

 

mc.jpg

Ez az öreg kis könyvecske már generációkat vezetett be az elmefilozófia és a kognitív tudomány kérdéseibe. Aki nem szereti a filozófiai hátteret, annak érdemes csak a hatodik (AI) és hetedik (Neuroscience) fejezeteket elolvasni, mert ezeknél világosabban eddig még senki sem tudta elmondani hogy mi az a neurális háló, hogyan tanul, meg mi köze van az emberi agyhoz.

 

 

 

 

 

 

 

cb.jpg

 Öreg, szép vastag könyv, ami azért már bele-bele megy a technikai részletekbe. Computational Neuroscience könyvnek szánták, de igazából valahogy a neurális hálókkal foglalkozók körében lett népszerű. A legfontosabb fejezetei elérhetőek online:

Neuroscience Overview 

Computational Overview

 

 

 

 

Aki szeret kódolni, annak ez az ingyenesen elérhető könyv nagyon hasznos lehet. Sajnos nem igazán foglalkozik sokat az elméleti háttérrel, ellenben igazán jó példákon keresztül ismerhetünk meg pár bevett technikát a segítségével.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Konf: Jövendőmondás - predikció a múlt és a jelen adatai alapján

2015.09.23. 09:38 Szerző: Zoltán Varjú Címkék: konferencia politikai blogok tartalomelemzés emócióelemzés nowcasting

Ma a MIBE konferenciáján velünk is találkozhattok, a részletes program itt található, alább pedig a slideok és válogatás korábbi, a témához kapcsolódó posztjainkból.

read-between-lines.png

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Született kiborgok vagyunk!

2015.09.17. 08:31 Szerző: Zoltán Varjú Címkék: diszlexia gráfok extended mind cognitive computing asszisztív technológia

Stelarc egyedi performanszaival az emberi test és elme kiterjesztésének lehetőségeit feszegeti. Az ausztrál művész projektjei futurisztikusnak tűnnek. Sokan idegenkednénk egy robotvégtagtól, vagy egy agyi implantátumtól. Andy Clark szavaival élve született kiborgok vagyunk és természetünk része, hogy tárgyak használatával, vagy más emberek segítségével kiterjesztjük elménket és testünket.  Mi pontosan ezen tulajdonságunkat kihasználva szeretnénk segíteni az olvasási nehézségekkel küzdőknek.

stelark.jpg

Elmosódó határok

A fejünkben gondolkodunk, számolunk, tervezgetünk, mérlegelünk. A koponyánkban ott van az agyunk, ami elvégzi ezt a sok műveletet. Ha az agyunk beszélni tudna, elmondaná nekünk, hogy baromira keveset tudunk arról mit is művel ő (akit érdekel, az itt elolvashatja mit mondana nekünk egy agy erről). De tényleg a fejünkben élünk? Szoktunk még úgy igazán fejben számolni? Ha nincs a kezünk ügyében egy mobil, egy számológép vagy egyéb elektronikus segédeszköz, akkor keresünk egy papírt meg egy tollat és nagyobb számokat bizony írásban adunk össze. Egyes műveleteket fejben végzünk, a részeredményeket papírra vetjük. Mondhatjuk, csak külső tárnak használjuk a papírt, de sokkal inkább interakcióba lépünk a külső elemekkel, hiszen a számolás műveletének szükséges része a papír és a toll használata. A kiterjesztett elme elmélete arra mutat rá, hogy az ember természete szerint rendszeresen használ külső tárakat, vagy akár éppen szervez ki teljes műveletek a világba. 

A nyelv rajtunk túl van

A nyelvhasználat az emberi nem egyedi jellemzője, eredetéről és funkciójáról a tudományos gondolkodás kezdetei óta ádáz viták folynak, melyek valószínűleg soha sem fognak dűlőre jutni. Clark zseniális esszéjében arra mutat rá, hogy a nyelv egyrészt amolyan metarendszerként is szolgálhat számunkra. Ez a metarendszer segít az elme adott állapotait "megfagyasztani" és vizsgálat tárgyává tenni. A belső beszéd (amikor agyalunk egy dolgon) ennek megnyilvánulása. A sok "most mit tegyek", vagy "miért nem hív fel" és egyéb problémák belső hadarása nem csak fárasztó lehet, de éppen segíthet saját magunk tapasztalatainak megértésében, strukturálásában. Folytatunk magunkkal dialógusokat is, pl: "Miért nem mondtam fel, amikor nekem adták ezt a kellemetlen feladatot? - Mert nagyon szereted a munkatársaidat te hülye!"

2d2a925474aabad0383bccfd4b1c51cf.jpg

A belső beszéd könnyen külsővé tehető. Saját magunk helyett mással is megbeszélhetjük gondjainkat, mások tapasztalatáról is tudomást szerezhetünk. Az írás megjelenésével több ezer éve élt emberek gondolataival ismerkedhetünk meg. Az internet lehetővé teszi pl, hogy a világ különböző pontjain élő programozók a StackOverflow platformon tegyenek fel kérdéseket egymásnak és kapjanak választ egymástól. A nyelvhasználat során "használjuk" a többi embert is.

 

Az, hogy a nyelvhasználat során kiterjesztjük elménket, az írott nyelv estében ez még nyilvánvalóbb. Amikor elkezdtem írni ezt a posztot, akkor elővettem a jegyzeteimet, újra olvastam a hivatkozott tanulmányokat, elbeszélgettem az irodán a kollégáimmal, elkészítettem egy vázlatot, átírtam, majd megint átírtam. Nem lineárisan szerkesztődik a szöveg, belepillantok a jegyzeteimbe, visszaolvasom mit írtam eddig, vitatkozok magammal. A szöveg nem a fejemben, hanem a gépen születik meg, a folyamat integráns része, hogy egyes elemei rajtam kívül vannak.

Clark esszéjének zsenialitása abban rejlik, hogy ő az első aki kimondja, a nyelvhasználat komputációs struktúrájának része, hogy kiterjesztjük elménket. A legtöbb nyelvmodell nem veszi figyelembe ezt, vagy az egyed felől közelíti meg a nyelvleírást, vagy a társadalmi szint felől. A két szint megkülönböztetése azonban lehetetlen, egy térben vannak.  

A gráfok és az asszisztív technológia

Úgy gondoljuk, az olvasási nehézségekkel küzdőknek segítségre van szükségük abban, hogy elméjüket hatékonyan tudják kiterjeszteni. A kognitív tudományokban egyre elterjedtebb a hálózatelméleti megközelítés, mind az egyed, mind a társadalom szintjén; az agyi hálózatoktól kedve, a szövegek struktúráját feltáró hálózatokon át a komplex nyelvi hálózatokig bezárólag. Saját kis projektjeink is megerősítettek abban, hogy a nyelvvel kapcsolatos vizsgálatokban bizony jó szolgálatot tehetnek a gráfok! Nézzük melyek ezek a területek:

  1. A nyelvi fejlődés leírása és modellezése [egyéni szint]
  2. Nagy korpuszok leírása és modellezése [szöveg szintje]
  3. Szemantikai és szóasszociációs hálózatok leírása és modellezése [globális nyelv leírása]
  4. Híroldalak és politikai blogok szövegei közötti hivatkozások [írott nyelvi dialógusok]

 

Korábbi, politikai tartalomelemzéssel kapcsolatos posztjainkban már mutattunk a gráf-alapú TextRank algoritmus segítségével készített szógráfokat egy-egy szövegről (l. itt és itt). Egy belső projekt kapcsán módosítottuk egy kicsit az eredeti algoritmust. Ekkor akadt kezünkbe egy tanulmány arról, hogy az automatikusan kinyert kulcsszavak kiemelése a szövegekben segíti a diszlexiások szövegértését. Úgy döntöttünk, alaposan kiértékeljük algoritmusunkat és azt hamarosan olvasási vizsgálatokban is bevetjük, hogy lássuk, tudunk-e használható megoldást kínálni az olvasási nehézségekkel küzdőknek. A projektről igyekszünk folyamatosan beszámolni olvasóinknak. Hamarosan folyt.köv!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása