Az évad első meetupján a BOK meetuppal közösen jövünk össze 2015. február 18-án 19:00-tól, rendhagyó módon ezúttal a SZTAKI-ban (Budapest, XI. Kende u. 13-17). Témánk a linked data, mi a fene is az, mire használják és mivel NLP meetup is egyben az esemény, a magyar WordNetről is hallhatunk majd, mint tipikus linked data adathalmazról. A részvétel ingyenes, de arra kérünk mindenkit, részvételi szándékát jelezze vagy a BOK, vagy az NLP meetup oldalán.
Szász Barnabás: Linked Data - van-e adathalmazoknak hálózati hatása?
A World Wide Web egy olyan globális infrastruktúrát hozott létre, amely lehetőséget nyújt összekapcsolt dokumentumok hálózatának a publikálására és elérésére. A Linked (Open) Data ennek mintájára - és a Web eredményeire és technológiáira építve - ad hasonló módon összekapcsolt adathalmazok publikálására és fogyasztására eszközöket. Az előadás egy bevezetőt ad a LOD világába, kitérve röviden a szemantika fogalmára, a Szemantikus Webes technológiákra és a LOD néhány gyakorlati alkalmazására, köztük az Apache Stanbol projekt rövid ismertetésével példát ad arra, hogy a LOD hogyan tudja akár az NLP-t támogatni.
Szász Barnabás több mint egy évtizede foglalkozik webes fejlesztéssel, nagyvállalati tartalomkezelő, metaadat kezelő és keresőrendszerek implementálásával és 2005 óta a Szemantikus Web kutatásával, jelenleg a Linked Data alkalmazásait és a szemantikus keresés lehetőségeit vizsgálja. A munkán túl újdonsült családapa, amatőr fotós és hobby-tengerész.
Horváth Ádám: Könyvtári és múzeumi adatok automatikus publikálása a szemantikus weben - az ALIADA projekt ismertetése
A könyvtárak és a múzeumok az adataik publikálásával vehetnek részt a szemantikus web építésében. Az ALIADA projekt ezt a folyamatot szeretné felgyorsítani azzal, hogy egy olyan nyílt forráskódú szoftvert hoz létre, melynek segítségével a könyvtárak és a múzeumok automatikusan publikálhatják az adataikat a szemantikus weben. Az előadásomban az ALIADA projektet szeretném ismertetni. Az előadásban ki szeretnék térni a Linked Open Data egyik felhasználási területére a Library of Congress új katalogizálási szabványára a BIBFRAME-re, mely teljes egészében a kapcsolt adatokon nyugszik.
Horváth Ádám informatikus könyvtáros az Országos Széchényi Könyvtár informatikai vezetője volt 10 évig. A könyvtárinformatika teljes spektrumában (integrált rendszerek, karakterkészletek, hálózati protokollok, visszakereső rendszerek, digitális könyvtár, stb.) elmélyült ismeretekre tett szert. Vezetése alatt a könyvtár a teljes állományát, valamint a tezauruszt és a név besorolási adatait publikálta a szemantikus weben, még 2010-ben. Később a Szépművészeti Múzeum dolgozójaként megismerkedett a múzeumi gyűjteménykezelő rendszerekkel is. Jelenleg a Magyar Nemzeti Múzeum Központi Könyvtárában dolgozik. Szabadidejében amatőr természetfotós és lelkes tanulója a kanadai és freestyle kenuzásnak.
Héder Mihály arról tart előadást, hogy hogyan kapcsolódik a Linked Data és az NLP a DBpedia Spotlight eszközön keresztül. Hogyan segít a Linked Data előállításában a human-in-the-loop gépi tanulás? Milyen mashup-ok épülnek a DBpedia adathalmazára? Hogyan hat ki mindez az ember-gép interfészek jövőjére?
Héder Mihály 2004-ben kezdett gyakornokként az MTA SZTAKI-ban. Okleveles mérnök informatikus diplomáját 2009-ben védte meg, 2014-ben filozófia PhD fokozatot szerzett. Szakterülete a mesterséges intelligencia filozófiája, szemantikus annotációk, szoftver integráció.
Miháltz Márton: Magyar WordNet a LOD felhőben
Ebben az előadásban egy konkrét erőforrást, a Magyar WordNetet szeretnénk bemutatni, az előadással kb. egy időben LOD felhőbe kerülésének apropójából. A Magyar WordNet (HuWN) egy természetesnyelvi ontológia, amely a Princeton WordNet elveit követve a nyelvi fogalmakat szinonimahalmazokkal (synsetekkel) reprezentálja és közöttük szemantikai viszonyokat definiálva (pl. hipernima (is-a), meronima (rész-egész), antonima stb.) hoz létre egy lexikális fogalmi hálózatot. Noha a wordnetekben a nyelvi fogalmak közötti taxonómia nem felel meg egy szigorú formális ontológia követelményeinek, az NLP különböző alkalmazásaiban mégis gyakran használják őket világismereti reprezentáció forrásaként. A Magyar WordNet 42 ezer synsetet tartalmaz, és össze van kapcsolva az angol (Princeton) WordNet 2.0-ás és 3.0-s verzióival, ami átjárást biztosít több mint 20 egyéb nyelv wordnetjeihez, illetve az angol wordnethez illeszkedő egyéb adatbázisokhoz (Yago, DBPedia, BabelNet stb.) A HuWN szabadon hozzáférhető, az előadással egy időben tervezzük RDF formátumú megosztását a LOD felhőben is.
Miháltz Márton az MTA Nyelvtudományi Intézet Nyelvtechnológia Kutatócsoportjának és a PPKE ITK Magyar Nyelvtechnológiai Kutatócsoportjának tudományos munkatársa. Korábban nyelvtechnológiai területen dolgozott az iparban (MorphoLogic, in4, GeoX). PhD fokozatát nyelvtechnológia témában 2010-ben szerezte a PPKE ITK-n. Kutatási területei az információkinyerés, véleményelemzés, jelentésegyértelműsítés, koreferenciafeloldás.