HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) lda (10) LDA (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Évadzáró NLP meetup november 21-én

2012.11.20. 12:00 Szerző: Zoltán Varjú Címkék: tartalomelemzés nlp meetup HuComTech gazadsági előrejelzés textplore

 

meetup.jpg

 

A Hungarian Natural Language Processing Meetup november 21-én zárja első évadját. A rendezvény 18:00-kor kezdődik a Colabs-ben, kérjük az érdeklődőket, hogy regisztráljanak az esemény oldalán (a részvétel ingyenes!).

A program:

Tóth István János - Hajdu Miklós: Gazdasági előrejelzések online folyamatok alapján

Az Internet penetrációjának növekedésével egyre jelentősebbé válik az online folyamatok relevanciája bizonyos gazdasági és társadalmi indikátorok becslésében, előrejelzésében. Előadásunkban bemutatjuk, hogy a Google adatai alapján miképp és milyen eredményességgel becsülhetőek egyes, a háztartási fogyasztással kapcsolatos mutatók, mint például a személyautók eladásának alakulása vagy akár a külföldi munkavállalással kapcsolatos potenciál. Emellett e kérdéskört az internetes tartalomszolgáltatók oldaláról is megközelítjük a Gazdaság- és Vállalkozáskutató Intézet online tartalomelemző szoftvere, a Textplore segítségével: kitérünk arra is, hogy a gazdasági reálfolyamatok hogyan hatnak az internetes médiában megjelenő cikkek tartalmára.

Az előadók:Tóth István János Közgazdász-szociológus, az MTA Közgazdaságtudományi Intézetének tudományos főmunkatársa, a Gazdaság- és Vállalkozáskutató Intézet ügyvezető igazgatója, a BCE Korrupciókutató-központjának társigazgatója. Fő érdeklődési területe a rejtett gazdasággal és a korrupcióval kapcsolatos jelenségek vizsgálata és a konjunktúrakutatás, továbbá szívesen foglalkozik a kvantitatív tartalomelemzés módszerével vizsgálható kérdésekkel.

Hajdu MiklósSzociológus, a Gazdaság- és Vállalkozáskutató Intézet elemzője, diplomamunkáját írja az ELTE Társadalomtudományi Karának survey statisztika mesterképzésén. Érdeklődik a munkaerő-piaci kutatások és a konjunktúravizsgálatok iránt, módszertani eszköztárát igyekszik az Interneten fellelhető információk feldolgozásával kapcsolatos eljárások megismerésével és alkalmazásával szélesíteni.

Dr. Ehmann Bea – Dr. Balázs László:Pszichológiai tartalomelemzés fejlesztések és alkalmazások az NLP-ben

Az NLP-n alapuló szövegelemzések (Clementine, Textrend, etc.) tudományos és üzleti alkalmazásának egy nyitott és remekül fejleszthető szegmense a pszichoszemantikai tartalmak területe. Ezekre épülő módszertanában a pszichológiai tartalomelemzés messze túllép azon, hogy csupán pozitív, illetve negatív tartalmakat keressen a projektekben. Az NLP alkalmazójaként, a pszichológiai tartalomelemzés lényege, hogy bizonyos szó- és kifejezés-kategóriákat, illetve több ilyen kategória mintázatát valamely pszichológiai konstruktum markerének tekinti, s ezek nagy dokumentumhalmazokban történő azonosítása és statisztikai elemzése révén képes feltárni és előre jelezni egyének, csoportok, szervezetek és a szociális média pszichológiai folyamatait.

Az előadás a pszichológiai tartalomelemzés űrpszichológiai alkalmazásának példáján (az Institute for Biomedical Problems és a European Space Agency által Moszkvában 2010-11-ben lefolytatott Mars-500 űranalóg szimulációs kísérlet legénységi kommunikációjának elemzése) mutatja be a pszichoszemantikai fejlesztések és alkalmazások előnyeit. Végül gondolatébresztő kitekintést kíván nyújtani arra, hogy a szakterület módszertana számos további területen is alkalmazható.

Az előadókról

Dr. Ehmann Bea

Pszichológus, az MTA Természettudományi Kutatóközpont, Kognitív Idegtudományi és Pszichológiai Intézetének tudományos főmunkatársa, a Narratív Pszichológiai Kutatócsoport tagja (www.mtapi.hu). Az ELTE Pszichológiai Intézetében, valamint a Pécsi Tudományegyetem Doktori Iskolájában a pszichológiai tartalomelemzés oktatója. Kutatási területe a többnyelvű pszichológiai tartalomelemzés és a csoportkutatás, ezen belül az izolált kiscsoportok pszichodinamikája.

Dr. Balázs László

Villamosmérnök, pszichológus, a Kognitív Idegtudományi és Pszichológiai Intézet Űrkutató Csoportjának vezetője (http://space.cogpsyphy.hu/). Fő kutatási területe a figyelem és a prefrontális kontroll funkciók vizsgálata olyan extrém körülmények között, mint a súlytalanság, oxigénhiány vagy alvásmegvonás. Részt vesz az extrém környezeti tényezők idegi és pszichológia hatásainak monitorozására szolgáló nyelvtechnológiai eszközök fejlesztésére irányuló kutatásokban is.

Szekrényes István:A HuComTech-korpusz és -adatbázis bemutatása

A HuComTech projekt keretében létrehozott multimodális élnyelvi korpusz egy kommunikációelméleti szakemberek, digitális képfeldolgozók és számítógépes nyelvészek nemzetközi együttműködésével, 113 egyetemi hallgató részvételével készített, 50 órányi annotált videó és hanganyagot foglal magába. Létrehozásának célja egy gépi betanításra; adatbányászatra; pragmatikai, szintaktikai és prozódiai irányú kutatásokra alkalmas empirikus erőforrás megteremtése volt. Előadásomban a korpusz és a belőle kinyert adatokból készített relációs adatbázis általános tulajdonságait, megalkotásának technikai lépéseit, felhasználási eszközeit kívánom bemutatni, kitérve a jelenleg is fejlesztés alatt álló egyéb feldolgozási lehetőségekre is.

Az előadóról

Tanulmányaim a Debreceni Egyetem Bölcsészettudományi karán végeztem filozófia – elméleti nyelvészet szakos hallgatóként. Érdeklődésem egyetemi éveim alatt meglehetősen szerteágazó volt, majd a HuComTech interdiszciplináris kutatóműhely tagjaként egyre inkább kísérleti jellegű, a modern kommunikációs technológiák területén felhasználható számítógépes nyelvészeti kutatások irányába tolódott el. Első projektunk keretében egy multimodális spontán beszéd adatbázis létrehozásában működtem közre, ahol feladataim jobbára az elkészített anyag számítógépes feldolgozása, konverziója, az adatbázishoz szükséges információk kinyerése, később a HuComTech-korpusz jelenleg is fejlesztés alatt álló automatikus prozódiai annotációjának kivitelezése köré csoportosultak. A kutatóműhelyben 2010 februárja óta működöm közre, A DENYDI számítógépes nyelvészeti alprogramjában 2011-ben kezdtem meg PhD tanulmányaimat.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

NLP matiné okt. 26-án

2012.10.23. 12:00 Szerző: Zoltán Varjú Címkék: meetup NLP meetup NLP matiné

Közeledik októberi meetupunk! Kicsit rendhagyó módon most rövid, ötperces intézmény/céges bemutatkozókat várunk - jelentkezni a zoltan.varju(kukac)gmail.com címen lehet. A meetup célja, hogy a számítógépes nyelvészettel foglalkozó, ill. a nyelvtechnológiai megoldások iránt (potenciális) felhasználóként érdeklődő cégek és intézmények bemutatkozhassanak egymásnak és a közönségnek. Ez az az alkalom, amikor nyugodtan hozhatsz magaddal céges ismertetőket, egy raklapnyi névjegyet, sőt nyugodtan megemlítheted, ha munkatársat vagy éppen partnert keresel. A részvétel ingyenes (mint midig), létszámkorlát nincs, de arra kérünk mindenkit, hogy a rendezvény oldalán regisztráljon és jelezze, hogy jön-e. Köszönet főszponzorunknak a WebLib Kft.-nek és médiapartnerünknek a nyest.hu-nak. A még nem végleges program:

meetup.jpg

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Sok a szöveg? - Magyarországi Web Konferencia 2012

2012.10.19. 14:42 Szerző: Zoltán Varjú Címkék: nyelvtechnológia webkonf

A Magyarországi Web Konferencia Sok a szöveg? című előadás anyagai.

Az előadás fóliái

Kapcsolódó anyagok

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Melyik mobil platformra fejlesszek?

2012.10.16. 15:29 Szerző: Kereso75 Címkék: mobil smartmobil

Már készülök a Kürt Akadémia Smartmobil képzésére, melyre október 19-ig lehet jelentkezni. A képzésen platformválasztás témában előadó leszek. Nyilván fontos tényező lehet, hogy potenciálisan mennyi embert érhetünk el egy-egy platformon.

Egyfajta teaserként, kicsit provokatív módon hadd tegyek közzé egy ábrát, amely azt mutatja, hogy a különböző operációs rendszerek, illetve fejlesztési platformoknak (a Java nem operációs rendszerként van a telefonokon) mekkora az elérése.

 mobil_applikációs_platformok_1.jpg

A vizszintes tengelyen az elérhető felhasználók száma millióban.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

Evernote Moleskine - régi és új

2012.10.16. 12:00 Szerző: Zoltán Varjú Címkék: mobil Evernote Moleskine Evernote Moleskine kézírás felismerés

Az IT jelen van mindennapjainkban, de vannak esetek, amikor a jó öreg toll és papír a legjobb eszköz. Kézírással lejegyezni egy gondolatot, vagy a "szalvéta hátoldalán gondolkodni" még mindig sokkal természetesebb, mint egy szoftvert (no meg egy készüléket amin fut) használni. Aki szeret jegyzetelni, az viszont tudja mennyire könnyű elveszíteni egy jegyzetfüzetet, milyen nehézkes keresni a feljegyzések között és milyen frusztráló lehet, ha otthon felejtjük aktuális füzetünket. A legismertebb jegyzetfüzet gyártó a Moleskine összefogott a legnépszerűbb szoftveres jegyzetkezelővel az Evernote-tal és megoldást talált a problémára.

Az összefogás lényege, hogy a Moleskine speciális jegyzetfüzetet kínál, kisiskolás zsargonnal csíkos avagy vonalas (ruled) és kockás, szebben négyzetrácsos (squared) formában. Sajnos hazánkban még nem rendelhetjük meg, és a legnagyobb Moleskine disztribútor, az Írók boltja sem tart még Moleskine Evernote-ot. A füzetekben találhatunk egy kódot, amivel három hónapig használhatjuk az Evernote prémium szolgáltatását. Jó esetben van egy iOS mobileszközünk (iPad 2 vagy 3, ill. iPhone, iPod Touch 3 vagy újabb) vagy egy jó Android készülékünk, amivel együtt működik az Evernote applikációja. Ha archiválni akarjuk kézzel készített jegyzeteinket, akkor egyszerűen a mobilkészülékkel lefotózzuk az adott oldalt. Amennyiben iOS eszközünk van, akkor a vonalak és a kockák speciális kialakításának köszönhetően a szoftver nagyon szépen javítja a megvilágítás okozta problémákat a képen. Ha nem használunk ékezetes betűket az írásunkban, akkor a karakterfelismerés is remekül működik, és pár pillanat alatt a papírra vetett jegyzet digitálisan is elérhető, kereshető és megosztható több készülék és felhasználó között.

A jegyzetfüzetek használata anakronisztikusnak tűnhet sokak számára, de bizony a legtöbb kreatív területen a mai napig használatban vannak. Az újságírók, írók, művészek és építészek mellett még a a technikai emberek körében is népszerű ez az analóg módszer, bizonyos körökben pedig ún. Hipster PDA használata dívik.

A fenti videó nagyon szépen mutatja be a Moleskine Evernote-ot működés közben. Azonban érdemes megjegyezni, hogy az Evernote Premium működik más jegyzetfüzetekkel is, igaz nem javítja fel olyan szépen a képet, mint a speciális lapokkal, de elfogadható eredményt produkál. A "stickers", azaz az apró felragasztható jelek használata nagyon jó ötletnek tűnik, de egyrészt hamar elfogynak, másrészt kizárólag iOS eszközök képesek felismerni őket, ellenben analóg papíron tageket rendelhetünk feljegyzéseinkhez, mely sokkal használhatóbb jegyzeteink kereshetővé tételéhez. A karakterfelismerő az ASCII karakterekkel egész jól elboldogul, amennyiben az Egyesült Államokban elterjedt, nyomtatott írásra hasonlító betűkkel írunk. A hazánkban is megszokott folyóírással nem igazán tud mit kezdeni az Evernote, az ékezetek végképp zavarba hozzák, ami már csak azért is furcsa, mert az angolban is akad pár szó, amiben használatosak pl. café vagy fiancé(e).

A Moleskine - Evernote együttműködés hivatalos bejelentése nagyon érdekes, mivel kiderül, hogy mindkét cég rájött arra, hogy nem konkurensei egymásnak, hiszen a felhasználók van amikor a digitális megoldásokat szeretik, van amikor a hagyományos jegyzetelést választják.

Ahogy az Evernote vezetője megjegyzi, sokáig a régi és az új harcának tekintették a papíralapú jegyzetelés és a szoftveres megoldások közötti konkurálást. A gyakorlat azt mutatja azonban, hogy sokkal természetesebb kézzel lejegyezni gondolatainkat, vagy egy előadáson jegyzetelni. Az Evernote okosan ismerte fel, hogy a felhasználók szeretik az ún. természetes (vagy inkább megszokott) interakciót, ezért létrehozta saját kézírás felismerő alkalmazását is, ami táblagépeken jól működik, de sajnos ez is csak a már említett korlátok között. Reméljük a technológia hamar kiforrja magát és túljut a gyermekbetegségein. Addig hipstereknek ajánljuk leginkább az Evernote Moleskine-t, főleg "vetítésre", a többiek várják ki, amíg a tervezők rájönnek, hogy a design driven (azaz design vezérelt) innovációt ki kell egészíteni technológiai ismeretekkel is, melyek már adottak (pl. jobb kézírás felismerés) és könnyen integrálhatóak lennének a termékbe.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása