HTML

Kereső Világ: keresés, szövegbányászat, big data

A keresők lelkivilága, szöveges keresés, szövegbányászat és big data.
2001 óta foglalkozunk keresőfejlesztéssel a Precognox kereteiben. A blog írói: Jóföldi Endre és Varjú Zoltán. A Goldenblog versenyen IT kategóriában a legjobb 3 blog közé választott minket a szakmai zsűri 2011-ben és 2012-ben is. 2013-ban a Biznisz blogok között hetedik helyen végeztünk.


Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat. Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, akkor lépj velünk kapcsolatba a céges oldalunkon található űrlapon keresztül.

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.



Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Főbb témák

adatok (12) adatújságírás (16) ajánló (4) állás (4) alternatív (6) alternatív keresőfelület (24) analitika (5) beszédtechnológia (10) big data (39) bing (14) blogkereső (5) clustering (6) computational social science (4) data science (7) digitális bölcsészet (4) egészség (7) egészség kereső (7) emócióelemzés (13) facebook (8) Facebook (7) fintech (5) firefox (4) goldenblog (5) Google (22) google (57) GoogleTrends (5) Google Ngram (4) Hadoop (6) helyi keresés (4) hírkeresés (4) internetes keresés (27) internetes keresők (4) internet hungary (6) iphone (5) johu (4) képkereső (8) keresés (50) kereséselmélet (7) keresés jövője (57) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (6) konferencia (11) könyvajánló (4) korpusznyelvészet (5) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (4) linked data (5) live (13) magyar (4) magyar kereső (9) marketing (8) meetup (16) metafora (5) metakereső (4) microsoft (4) miner (4) mobil (30) mobil keresés (15) Neticle (7) NLP meetup (4) nlp meetup (5) Nuance (8) nyelvészet (8) nyelvtechnológia (51) open data (7) Pennebaker (4) pénzügy (6) politika (4) Precognox (15) Precognox Labs (9) seo (5) smartmobil (4) sna (4) spam (6) statisztika (5) számítógépes nyelvészet (5) szemantikus keresés (15) szemantikus kereső (10) szemantikus web (8) szentimentelemzés (21) szövegbányászat (11) társadalomtudomány (4) tartalomelemzés (16) tartalomipar (5) tartalomjegyzék (6) tematikus kereső (20) Twitter (23) twitter (13) Twitter forradalom (4) valósidejű keresés (4) vertikális kereső (9) vizualizáció (10) wikia (4) Wikipedia (4) wolframalpha (4) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Az angol bizony nem elég!

2014.04.15. 09:54 Szerző: zoltanvarju Címkék: nyelvek nyelvtechnológia

Ma már minden angolul van! Aki nem tud angolul, az nem is létezik! Nem érdemes foglalkozni más nyelvekkel, ami számít az úgyis meg fog jelenni angolul! Az előbbi mondatok nem képezik hivatalos álláspontunkat, csupán az utóbbi időkben egyre gyakrabban hallunk ehhez hasonló kijelentéseket - és akik így vélekednek azok TÉVEDNEK! Nem csak a szép bölcsész lelkünk mondatja ezt velünk, hanem a rideg gazdasági racionalitás is.

arabic_cloud.jpg

Habár nem szeretünk az angol (és esetleg anyanyelvünk) mellett más nyelvekkel próbálkozni, általánosan elterjedt siránkozni amiatt, hogy telített a piac. A válság után még mindig nehéz kinyitni a megrendelők pénztárcáját is. Érdemes megnézni, hol van most tartós növekedés! A pénzügyi világban elterjedt mozaikszavak, mint a BRIC (Brazília, Oroszország, India, Kína), BRIMC (Mexikót takarja az M), BIRCA (ahol az A az arab országokat jelöli) ill. a BRICET (az E kelet-európa, a T pedig Törökország) jelzik merre érdemes nézelődni. 2001 és 2011 között ezen országok nyelvein megjelenő netes tartalmak száma hihetetlen mértékben növekedett!

the growth in English usage online stands at just over 281% over the past decade – far less than Spanish (743%), Chinese (1,277%), Russian (1,826%) or Arabic (showing a massive growth of 2,501% over the same period). [forrás]

Ezek bizony nem kicsi nyelvek, rajta vannak a tíz legnagyobb nyelv listáján, de jelenleg "alig" használják őket az interneten. A kínait a világ lakosságának kb. 14.4 százaléka beszéli, az internetes tartalmak terén az aránya viszont csupán 3.3%. Az arab nyelv különféle változatait kb. 300 millióan beszélik mint első nyelv és összesen 450 millióan értik, ami több mint az emberiség 4%-a, de weboldalak kb. 0.8%-a érhető el arabul. (Az érdeklődő olvasó figyelmébe ajánljuk az Ethnologue statisztikáit a világ nyelveiről és a Wikipedia szócikkét az internetes arányukról.) A globalizáció ellenére, ahogy erősödik ezen országok gazdasága, egyre többen anyanyelvükön kezdik használni az internetet. Nekik pedig előbb, vagy utóbb szükségük lesz nyelvtechnológiai megoldásokra...

 

Jelenleg a feljövőben lévő nyelvekkel leginkább a kormányzati és pénzügyi elemzéseket végző kutatók foglalkoznak. A Twitter forradalmak kutatása, a társadalmi változások közösségi média elemzéssel történő előrejelzése, vagy a hírelemzés a nyugati világ mániája még manapság. De érdemes elgondolkodni azon, hogy ezen a területen növekedés és biztos kereslet mutatkozik és valószínűleg ez még sokáig így is marad!

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

A munkanélküliség előrejelzése a jobmonitor keresési adataival

2014.04.09. 17:38 Szerző: kittibalogh Címkék: munkanélküliség előrejelzés internetes keresés Precognox Labs Jobmonitor

Hal Varianék Google Trends adatokkal kiegészített gazdasági előrejelzéseit követve a Precognox Labs kipróbálta magyar adatokon, vajon hasznunkra lehet-e a hivatalos statisztikák kiegészítése internetes keresési adatokkal. A vizsgálathoz a KSH és az NFSZ hivatalos munkanélküliségi statisztikáit használtuk fel, melyeket a jobmonitor.hu álláskeresési adataival bővítettük ki a pontosabb becslés érdekében.

jobmonitorlogo.jpg

A felhasznált idősoros adatok és 2013-as trendjük

A munkanélküliség előrejelzésénél a Központi Statisztikai Hivatal és a Nemzeti Foglalkoztatási Szolgálat statisztikáit vettük alapul. Mindkét hivatalos szerv adattáblái megtalálhatóak honlapjukon, a KSH munkaerő-piaci statisztikái a http://www.ksh.hu/munkaeropiac címen, az NFSZ statisztikái pedig a http://www.afsz.hu/engine.aspx?page=full_AFSZ_KOZOS_Statisztika címen érhetők el. A KSH a munkanélküliek számának háromhavi átlagát közli havonta, úgy, hogy az első időszak adott évben januártól márciusig tart, a második februártól áprilisig, a harmadik márciustól áprilisig és így tovább, tehát összesen 10 teljes időszak esik egy évre. Az NFSZ a nyilvántartott álláskeresők számát havi bontásban közli minden hónapban.

A két hivatal eltérő módszertannal dolgozik, amiből némi különbség adódik a két adatsor között. A KSH a Nemzetközi Munkaügyi Szervezet által bevezetett munkanélküli definíciót használja, melyet a KSH a munkaerő-felmérés során önbesorolás alapján mér fel. Azt a személyt tekintik munkanélkülinek, aki az adott héten nem dolgozott és nincs is olyan munkája, amitől átmenetileg távol lenne, ezen kívül aktívan keresett munkát a felmérést megelőző négy hétben, valamint munkába tudna állni két héten belül, ha találna megfelelő munkát. Az NFSZ a nyilvántartott álláskeresőkről vezet statisztikát. Nyilvántartott álláskeresőnek számít az a személy, aki rendelkezik a munkaviszony létesítéséhez szükséges feltételekkel, nem számít gazdaságilag inaktívnak (tanuló, öregségi vagy rokkantnyugdíjas), nem áll alkalmi munkaviszonyban és az illetékes kirendeltségnél álláskeresőként van nyilvántartva. A két halmaz jórészt fedi egymást, azonban a nem közös részbe leginkább azok a személyek tartoznak, akik ugyan nyilvántartott álláskeresők, azonban nem felelnek meg a KSH munkanélküli definíciójának, mert például dolgoztak 1-2 órát az adott héten vagy nem kerestek aktívan állást a felmérést megelőző egy hónapban. Emiatt a nyilvántartott álláskeresők száma általában 80-150.000 fővel magasabb a munkanélküliekénél, de mozgásuk egymással összhangban alakul. (ld. Ábra 1. és 2.)

2013-ban a munkanélküliek száma negyedévről negyedévre csökkent, amely eltér a munkanélküliség megszokott éves szezonális mozgásától. (ld. Ábra 1.) A szokásos mozgás szerint az I. negyedév során megemelkedik a munkanélküliek száma, a II. negyedévben lecsökken és a III. vagy a IV. negyedévtől újra megemelkedik. Ezzel ellentétben 2013-ban csak az első negyedévben növekedett a munkanélküliek száma 2012 IV. negyedévéhez képest, azután folyamatosan csökkent. A KSH munkaerő-felmérése alapján a munkanélküliek 2013. évi átlagos létszáma 448 900 főnek felelt meg, az első negyedéves átlag 508 740 főt számlált, mely a IV. negyedévre 403 320 főre csökkent.  A szezonális jelleg mérséklődése a közmunkaprogrammal magyarázható, mely leginkább a téli közmunkaprogram hatásaként mutatkozik meg a IV. negyedévben.

Az álláskeresők számánál ugyanezt a tendenciát figyelhetjük meg, az első negyedévi átlagos 620 126 főről 414 270 főre csökkent a nyilvántartott álláskeresők létszáma 2013 IV. negyedévére, az éves átlagos létszám pedig 528 000 főnek felelt meg. (ld. Ábra 2.) A csökkenés mértéke a KSH szerint azért volt nagyobb a nyilvántartott álláskeresők körében, mint a munkanélküliekében, mivel a közmunkában való részvétel lehetősége és az álláskeresőként történő nyilvántartás között közvetlen kapcsolat áll fenn, tehát azt a halmazt érinti jobban a közmunkaprogram, akik nyilvántartott álláskeresők, azonban nem számítanak munkanélkülinek.

unem.png

Ábra 1. A munkanélküliek számának alakulása 2013. január-március időszakától október-december időszakig (KSH)

ak.png

Ábra 2. A nyilvántartott álláskeresők számának alakulása 2013. januártól decemberig (NFSZ)


A jobmonitor.hu adatai és a benne rejlő lehetőségek

A jobmonitor.hu egy álláskereső oldal, mely összegyűjti más álláskereső oldalak álláshirdetéseit és biztosítja a keresést a meghirdetett állások tevékenysége és területi elhelyezkedése szerint. A jobmonitor adatainak nagy előnye, hogy a keresésekről és álláshirdetésekről akár napi szinten is számot tudunk adni, ami által könnyen hozzáigazíthatjuk az adatokat más statisztikákhoz, valamint a későbbiekben lehetőséget nyújt naprakész jelentések készítésére.

A kereséseket elsősorban álláskereső, munkanélküli emberek indítják, ezért feltételezzük, hogy a keresések volumene összefüggésben van a munkanélküliek számának mozgásával, azonban nem fedi le azokat teljesen. Egyrészt az álláskeresések növekedése feltételezésünk szerint ellentétesen jár együtt a munkanélküliek mozgásával, amit a Google Trends irodalom is megerősít.  Tehát ha nő az álláskeresések mértéke, a munkanélküliségnek csökkennie kell. Másrészt a hivatalos munkaerő-piaci statisztikákba a közfoglalkoztatottak, valamint a külföldi telephelyen dolgozók számát is beleszámolják, ami befolyással lehet a foglalkoztatotti és munkanélküli statisztikák trendjeire. A 2013-as munkanélküli statisztika csökkenő tendenciájában pont ezeknek a csoportoknak a növekedése játszik közre. A jobmonitor keresési adatai ezzel szemben inkább a piaci szféra helyzetét tükrözik, melybe nem zavar bele a közfoglalkoztatottság, valamint a területi bontás miatt a külföldön dolgozni kívánók adatait is ki tudjuk szűrni. Ezért, ahogyan 3-5. ábrák is mutatják, a jobmonitor keresések éves mozgása eltér a hivatalos statisztikák tendenciáitól, a keresések átlagos száma a II. és a IV. negyedévben is emelkedett.

2009-ben Hal Varian, a Google vezető közgazdásza a Google egy másik közgazdászával, Hyunyoung Choijal közösen megírták a Predicting the Present with Google Trends c. tanulmányukat, melyben leírják, hogy a Google Trends keresési adataival korrigált hivatalos statisztikák előrejelző modelljei előbb képesek jelezni a gazdasági folyamatok változásait, valamint sok esetben pontosabbak, mint a keresési adatok nélküli modellek. Az állításukat több példával is igazolják, többek között az egyesült államokbeli kiskereskedelmi eladások, autó eladások, utazások, valamint az egyesült államokbeli munkanélküliség idősoraival. Ezután többen követték Varianék útját más országbeli és/vagy másféle adatokkal, melyek mind alátámasztották állításukat. Több kutató is sikerrel állította elő saját munkanélküliséget előrejelző modelljét, melyben összegyúrták az adott ország hivatalos statisztikáját a Google Trends adatokkal. Erre példa Askitas és Zimmermann német, D’Amuri és Marcucci olasz, valamint Anvik és Gjelstad norvég adatokat felhasználó modellje. Általános megállapításuk, hogy a Google kereső adatainak felhasználásával több esetben is előbb tudták jelezni, ha az idősor trendje megváltozott. Ezek a tanulmányok vezettek minket arra, hogy kipróbáljuk, vajon magyar adatokkal is működnek-e az internetes keresési adatokkal kiegészített előrejelző modellek, melyet a jobmonitor keresési adataival és a KSH, valamint az NFSZ hivatalos statisztikáival próbáltunk ki.

jmsimi.png

Ábra 3. A jobmonitor keresések számának alakulása 2013. januártól decemberig, simítás polinomiális regresszióval

jmtöbbsimi.png

Ábra 4. A jobmonitor keresések számának alakulása 2013. januártól decemberig, spline simítással

jm.png
Ábra 5. A jobmonitor keresések számának alakulása 2013. januártól decemberig havi bontásban

Előrejelző modellek 2014. januárra és februárra

Az előrejelzés során két hónappal becsültünk előre a 2013-as évi adatok alapján, ugyanis ezek az adatok már rendelkezésünkre állnak 2014-re mind a KSH, mind az NFSZ által, így egyből ellenőrizni is tudtuk becsléseink pontosságát. A KSH szerint a munkanélküliek száma 2014. januárban és februárban tovább folytatta a 2013-as évi csökkenő tendenciát, míg az NFSZ adatai alapján a nyilvántartott álláskeresők száma januárban megtörte az egy éves tendenciát és újra nőni kezdett februárban is folytatva a növekedést. Első lépésben megnéztük, mit mutatnak az előrejelzések csak a KSH, illetve az NFSZ 2013. évi idősorainak adataiból becsülve, majd egy a hivatalos statisztikákat és a jobmonitor keresési adatokat egyesítő modellel is elkészítettük az előrejelzéseket.

A 6. ábrán a munkanélküliek 2014. januári és februári számára vonatkozó becslései láthatóak, melyek mind megjósolják a december-februári csökkenő tendenciát. A valós értékhez legközelebb álló előrejelzéshez a Holt módszerrel és a spline simítással jutottunk. A hivatalos statisztikák és a jobmonitor keresési adatait egyesítő modell, mely a log(yt) ~ ß0 + ß1 * log(xt) + ealakot veszi fel, azt adja meg, hogy egy adott időszakban mekkora a munkanélküliek mértéke. Ezt az értéket az adott időszakra vonatkozó jobmonitor keresések és a hivatalos statisztika munkanélküliségi adatai együttesen befolyásolják. A modellben szereplő ß1 érték arra vonatkozik, hogy milyen mértékben nő vagy csökken a munkanélküliség, ha a keresések mértéke(xt) változik. Tehát ha a KSH munkanélküli statisztikájából és a jobmonitor adataiból álló modellt nézzük, akkor a ß1 értéke -0.079 lett, ami azt jelenti, hogy a jobmonitor keresések 1%-os növekedésével 7,9%-kal csökken a munkanélküliek száma. A modell segítségével nem csak arra az időszakra lehet kiszámolni a munkanélküliek mértékét, amely időszak alapján a modellt létrehoztuk, hanem jövőbeli időszakokra is becslést tudunk adni. A modellel készített előrejelzés a 2013. decembertől 2014. februárig tartó időszakra 0,018%-os csökkenést becsült a valós 3,33%-os csökkenés helyett, tehát a tendenciát jól jelezte, azonban a csökkenés mértékét nem.

 

kshfore.png

Ábra 6. A munkanélküliek számának valós alakulása és különböző becslései 2013. január-márciustól 2013. december-2014. februárig

kshjm.pngÁbra 7. A munkanélküliek számának előrejelzése 2013. december-2014. február időszakra


A nyilvántartott álláskeresők száma mind januárban, mind februárban emelkedett, azonban ezt a tendenciabeli változást egyik előrejelzés sem tudta kimutatni, ugyanis mindegyik a 2013. évi tendencia szerinti csökkenés folytatását várta. (ld. Ábra 8.)

Az NFSZ és a jobmonitor adataira számolt modell azonban beváltotta a hozzá fűződő reményeket. A modell értékei szerint ha 1%-kal nő a jobmonitoros keresések mértéke, 44,17%-kal csökken a nyilvántartott álláskeresők száma. Ez a modell tehát jelezni tudta a januári-februári tendenciabeli változást, amire egyik másik előrejelzés sem volt képes. Januárra 0,8%-os jósolt, februárra pedig 0,04%-os emelkedést jósolt, amely ugyan elmarad a valós százalékoktól (5% és 1,4%), de megerősíti a Google Trends irodalom azon megállapítását, hogy a keresésekkel kiegészített modellek előbb előrejelzik a trendbeli változásokat.

nfszfore.png

Ábra 8. A nyilvántartott álláskeresők számának valós alakulása és különböző becslései 2013. januártól 2014. februárig

nfsz.jm.png

Ábra 9. A nyilvántartott álláskeresők számának előrejelzése 2014. januárra és februárra


Következtetések

A használt becslések megerősítették, hogy a hagyományos előrejelzések nehezen képesek a trendbeli változások kimutatására. A keresési adatokkal kiegészített modellünk még ugyan finomításra szorul, azonban eredményeink így is biztatóak, és azt jelzik, hogy érdemes a hivatalos munkanélküli statisztikákat a jobmonitor keresési adataival kiegészítenünk. A kapott értékek alapján a netes álláskeresések mértéke előrejelzi az álláskereső személyek számának mozgását, méghozzá ellentétes irányban, azaz ha nő az álláskereső tevékenység mértéke, csökken a munkanélküliek száma. Az álláskereső tevékenység megelőzi a munkába állást, ezért ha nő a webes munkakeresési tevékenység intenzitása, arra számíthatunk, hogy a nagyobb befektetett munka következményeként az emberek nagyobb valószínűséggel fognak munkát találni maguknak. Így elképzelhető, hogy az álláskeresésre irányuló webes keresések előbb mutatják a munkanélküliek csökkenését, mint maguk a hivatalos statisztikák, ezért a jövőben modellünkbe érdemes lesz az eltérés időtényezőjét is belevenni.


Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Szemantikai-pragmatikai konferencia Szegeden

2014.04.08. 10:42 Szerző: annapetra Címkék: konferencia szemantika pragmatika

A Szegedi Tudományegyetem Általános Nyelvészeti Tanszéke és a Pragmatika Centrum Országos Kutatóközpont konferenciasorozatot indít Újdonságok a szemantikai és pragmatikai kutatásokban címmel.

54958288.jpg

 


A konferencia időpontja 2014. április 11., helye pedig a Szegedi Tudományegyetem Bölcsészettudományi Karának (Szeged, Egyetem u. 2.) Kari Konferenciaterme. A konferencia szervezői Maleczki Márta, Németh T. Enikő és Szécsényi Tibor.

A konferencián résztvevők hallhatnak érdekességeket az átokhasználat pragmatikájáról, illetve megtudhatják, meddig is ér a nganaszan takaró.

A konferencia előadásai alapján beküldött tanulmányok a Jelentés és nyelvhasználat címmel indítandó új elektronikus folyóiratban fognak megjelenni.

A konferenciára előzetes regisztráció nem szükséges.
Az esemény facebook oldala itt érhető el.

 

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Robotok: bevándorlók a jövőből

2014.04.03. 08:00 Szerző: zoltanvarju Címkék: ajánló robotok mesterséges intelligencia

Vezető nélküli autók, autonóm porszívók, drónok - az utóbbi évtizedben egyre több robot jelent meg életünkben, a The Economist melléklete szerint ők nem mások, mint bevándorlók a jövőből. Habár az iparban - különösen a gépgyártás és az autóipar területén - már régóta alkalmaznak robotokat, napjainkban érkeztünk el egy fordulóponthoz, amikor több technológiai tényező együttállásának köszönhetően kritikus tömegű robotikai kutatás és vállalkozás gyűlt össze. A nagy dobásra még várni kell, a mennyiség még nem csapott át minőségbe, de a köztünk "élő" robotok betekintést nyújtanak a jövőbe!

 2014-04-01 08.10.51.png

A The Economist csatornáján a riport szerkesztője röviden összefoglalta a robotika jelenlegi helyzetét. Akik a cikkeket szeretnék bogarászni, azok figyelmét felhívjuk arra, hogy a lap ún. metered paywall modellben csak napi pár írást tesz elérhetővé ingyen - ezért előfizetéssel nem rendelkező olvasóinknak be kell osztaniuk a cikkeket.

 

A riport érdekessége, hogy az ipari robotok fő használói Dél-Korea és Japán után európai államok! Nem véletlen, hogy külön a robotikával foglalkozó kockázati tőketársaságok alakulnak sorra az öreg kontinensen!

2014-04-01 08.13.33.png

Hogy mit hoz a jövő, azt nem tudhatjuk. Azonban elgondolkodtató, hogy a robotok által betöltött állások helyett valószínűleg kevesebb új munkahely jön majd létre. Ha szerencsénk van, akkor Marx jóslata szerint minden ember felszabadul a munka terhe alól s művésszé válhat, ha nem akkor McAfee és Brynjolfsson (sajnos empirikusan is alátámasztott) jóslata szerint egyre tovább nyílik a gazdag és technológiai újításokhoz hozzáférő réteg és a szegények között. A robotok itt vannak, meglátjuk mihez kezdünk velük (és ők mihez kezdenek velünk!)

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

CEU MicroData is hiring a junior programmer to perform text analytics tasks

2014.04.02. 08:00 Szerző: zoltanvarju Címkék: állás nyelvtechnológia CEU CEU Microdata

CEU MicroData is hiring a junior programmer to perform text analytics tasks. You would work with a team of faculty, programmers and research assistants to identify and match Hungarian firms and individuals by their name and address.

ceu_microdata.png

Required skills:

  • familiarity with standard Unix text processing tools

  • demonstrated expertise with a high-level programming language (preferably Python)

  • fluent Hungarian, conversational English

  • experience with text processing is a plus


You would be working 20 hours a week with flexible schedule. We are paying market wages and providing a better-than-market work environment.


If you are interested, please send your CV and samples of your programming work to Miklós Koren at korenm@ceu.hu.


CEU is an equal opportunity employer.

 

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre