HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Fogalmi metaforák

2014.02.27. 08:00 Szerző: Zoltán Varjú Címkék: nyelvészet vendégposzt metafora kognitív nyelvészet

Falyuna Nóra írása

Lévén, hogy a nyelvhasználat nemcsak grammatikai kategóriákból tevődik össze, ezért a nyelvtechnológiai fejlesztésekhez szükséges további, a nyelvhasználatot lehetővé tevő mentális és egyéb tényezők vizsgálata. Ilyenek többek között a kognitív nyelvészet eredményei, például az ontológiakészítés, a szentimentelemzés, illetve a tartalomelemzés érdekét is szolgáló fogalmi metaforák témaköre.

nora01.PNG

A metafora szó az emberek többségének az irodalmi szövegekben a szemléletesség, valamiféle hatás kiváltásának eszközeként használt költői képet jelenti. Ám a metaforák használata koránt sem korlátozódik csupán az esztétikai szövegekre. A mindennapi nyelvhasználat során is számos metaforikus kifejezést hívunk segítségül gondolataink, érzéseink megjelenítésére úgy, hogy gyakran nem is vagyunk tudatában annak, hogy metaforát használunk. Sőt, nem csak a köznyelvben, még a szaknyelvek esetében is élünk metaforák használatával.

A kognitív nyelvészeti irányzat hívta föl a figyelmet arra, hogy a metaforikus nyelvi kifejezések áthatják életünk minden területét, és hogy a metaforák nem pusztán nyelvi szinten jelennek meg, annál jóval többek: gondolkodásunk részét képezik. Ilyen értelemben a metaforák fogalmi jellegűek, tapasztalati eredetűek, következésképp fogalmi metaforákkal van dolgunk, amelyek a beszéd során metaforikus nyelvi kifejezések formájában öltenek testet.

nora02.PNG

Fogalmainkat a minket körülvevő (fizikai és szociális) valóság megtapasztalása során, mentális reprezentációkként konstruáljuk. A kognitív feldolgozás folyamatában a környezeti ingereket szelektáljuk figyelmünk irányításával, majd a vett ingereket kódoljuk, illetve az információkat értelmezzük. Ezekből következtetéseket vonunk le, és értékeljük is őket (így a mentális és a nyelvi reprezentációk is magukban hordoznak bizonyos ítéleteket). A megszerzett, és értékelt információink leképeződnek emlékezetünkben, absztraháljuk őket, valamilyen általánosabb jelentést, fogalmat hozunk belőlük létre, majd absztrakt struktúrába rendezve fogalmi sémákat alkotunk, amelyek egy adott prototípus köré szerveződnek.

Ez a prototípus alapú megközelítés a kognitív nyelvészet értelmezése a kategorizáció folyamatának leírására. A prototípus-elmélet lényege röviden összefoglalva abban áll, hogy a kategorizáció tipikalitási feltételekkel (a kategóriára jellemző tulajdonságokkal) kijelölt prototípusok segítségével történik. A prototípus az összes tipikalitási feltétellel rendelkezik, ám nem szükséges, hogy minden kategóriába tartozó tag minden tulajdonsággal bírjon, lényeg, hogy a tulajdonságok a tagok között megosztva jelen legyenek. A tagok között legyenek hasonlóságok, ám nem szükséges, hogy minden tag minden másik taggal megegyező tulajdonsággal bírjon. Ez az elgondolás a családihasonlóság-elve, amelyre épül a prototípus-elmélet. (Röviden összefoglalva: a meglévő tulajdonságok különböző kombinációkban jelennek meg a tagok között, és így a „család” nem definiálható egyetlen közös tulajdonsággal, hanem az köti össze a tagokat, hogy bizonyos tulajdonságok megegyeznek köztük.)

A kategorizáció tevékenysége egy velünk született, mindennapos, jellemzően nem tudatos képességünk, melynek során a világban tapasztaltakat kategóriákba, fogalmi sémákba rendezzük. A kognitív irányzat szerint ezek a kategóriák nem merevek, hanem a környezeti ingerek hatásra módosulhatnak, így a minket körülvevő és általunk befogadott (fogalmilag megkonstruált) világ nemcsak közegét képezi gondolatainknak, hanem teremtője is annak.

Mivel nyelvi kifejezéseink fogalmi jellegűek, ha a külső ingerek hatására fogalmainkban változás történik, az megjelenik azok nyelvi reprezentációiban is, következésképpen a szójelentés is módosulhat. Az efféle jelentésváltozások a kognitív megközelítés alapján (gyakorta) metaforikus, illetve metonimikus eredetűek.

Egy fogalmi metafora két tartományból tevődik össze: forrástartományból és céltartományból. A két tartomány összekapcsolása során egy a forrástartományból származó fogalmat társítunk egy a céltartományhoz tartozó fogalomhoz, így előbbi segítségével konceptualizáljuk utóbbit. Ez az összekapcsolás jelentkezik metaforikus nyelvi kifejezéseinkben.

Ezt az összekapcsolódást bizonyos megfelelések teszik lehetővé. A megfelelések részlegesek, mert a két tartománynak nem minden kognitív eleme kapcsolódik össze. Némely forrástartománybeli elem kapcsolódik egyes céltartománybeli elemhez. Az, hogy nem minden elem képeződik le valamilyen másik elemre, illetve nem minden elemre képeződik le egy másik elem, teszi lehetővé, hogy a későbbiekben új fogalmi metaforák létesülhessenek, illetve új metaforikus nyelvi kifejezéseket alkalmazzunk.

Mivel a fogalmak közti megfelelések részlegesek, egy forrástartomány több céltartomány konceptualizálásában részt vesz, és vice versa: egy céltartomány több forrástartomány segítségével értelmezhető. Ennek oka a forrástartományból használt elem jelentésfókusza, amely a fogalmi metafora fő témájává válik.

Konkrét példán szemléltetve:
Vegyük azt a kifejezést, hogy „ég a szerelemtől”. Ebben a SZERELEM TŰZ fogalmi metaforát fedezhetjük föl, melyben a SZERELEM a céltartomány, amelyet az TŰZ mint forrástartomány segítségével értünk meg.

A fogalmi metafora fő fókusza a TŰZ fő témája, amelyet leképezünk a SZERELEMre, jelen esetben a TŰZ intenzitása (ég a szerelemtől, lángra lobbantotta szívét, kihűltek érzéseik). Ám mivel nem vesz részt a metafora létrejöttében sem a TŰZ, sem a SZERELEM fogalmát alkotó összes kognitív elem, a megfelelések részlegesek:

Forrás: TŰZ => Cél: SZERELEM
           égő dolgok => szerelmesek
           tűz intenzitása => az érzelem intenzitása
           tűz lángra lobbanása => szerelem kialakulása

nora03.PNG

Ahogy korábban írtam, a környezeti ingerek hatására fogalmainkban módosulások mehetnek végbe, tehát a kognitív feldolgozás során kialakított kategóriánk nem merevek, változhatnak. Ez teszi lehetővé, hogy a világ változásával új fogalmakat, ezáltal új fogalmi metaforákat konstruáljunk.

Például a technológia és a tudományok fejlődése következtében megjelent a SZERELEM GÉP fogalmi metafora (nyelvi reprezentációja például a „szerelmük igen jól működik”, ennek jelentésfókuszában a GÉP, és így a SZERELMI KAPCSOLAT működése lesz).

Ennél a példánál láthatjuk, hogy itt már nem pusztán a SZERELEM, hanem a SZERELMI KAPCSOLAT alkot metaforát a GÉP fogalmával, ám a nyelvi reprezentáció során a szerelem szót használjuk. Ennek oka az, hogy fogalmaink konceptualizálásában, és szavaink jelentésváltozásában nem csak metaforák játszanak fontos szerepet, hanem metonimikus kapcsolatok is.

A metonímia és a metafora között egyezik, hogy mind a kettő esetében egy fogalom egy másik fogalom megértésében játszik szerepet, tehát egy entitás egy másik entitást „helyettesít”, és így az egyik megjelenítésére szolgáló nyelvi kifejezések használhatók a másik reprezentálására is.

Különbség, hogy míg metafora esetében a két fogalom két külön tartományból kerül ki, addig a metonímia esetében a két entitás (közvetítő-és célentitás) ugyanabba a fogalmi tartományba tartozik, tehát tapasztalatainkban együtt jelentkeznek.

Előző példánkra visszatérve, a szerelem szó jelentései, és használati lehetőségei metonimikus összefüggések eredményei. A SZERELEM idealizált kognitív modelljében, fogalmi keretében megjelennek a szerelmes felek, az általuk érzett érzelem, a köztük lévő kapcsolat, az ezzel jelentkező viselkedések, attitűdök, stb. Példánkban a SZERELMI KAPCSOLAT jelent meg, ám a metaforikus kapcsolat a SZERELEM és a GÉP között létesült, a nyelvi kifejezés ezt a kapcsolatot reprezentálta. Miként lehetséges ez?

Úgy, hogy metonimikus viszonyok eredményezhetnek további metaforikus kapcsolódásokat. Első lépésben tehát a SZERELEM A SZERELMI KAPCSOLAT HELYETT metonímiát megalkotjuk (például: szerelmük igen erős kifejezésben nem a SZERELEM, hanem a SZERELMI KAPCSOLAT az erős). A következő lépésben metaforikusan összekapcsoljuk egy más tartománybeli elemmel, jelen esetben az ERŐvel.

A kognitív nyelvészet e vizsgálatai lehetővé teszik többek között a poliszémiák másfajta megközelítési módját. Poliszémia alatt a többjelentésű szavakat értjük, melyek esetében a több jelentések között van valamiféle kapcsolat, nemcsak véletlenszerűek. Ez a kapcsolat nem csupán a közös etimológiában állhat, hanem a fentebb részletezett metaforikus és metonimikus összefüggésekre vezethető vissza.

Továbbá fontos szerepet kap a neológ kifejezések, a neologizmusok vizsgálatában is. A neologizmusokban megjelenő metaforák és metonímiák vizsgálatáról, neologizmusok elemzéséről olvashatunk például Sólyom Réka írásaiban: Neologizmusok a mai magyar szókészletben; Neologizmusok kognitív szemantikai megközelítése; Szóösszetétellel keletkezett neologizmusok szemantikai szerkezetének vizsgálata.

nora04.PNG

Ezen túlmenően a fogalmi metaforák vizsgálata lehetővé teszi, hogy fogalmaink hálóba rendeződését is vizsgáljuk, amely minden olyan területen hasznos lehet, ahol az asszociáció szerephez jut. Például különféle pszichológiai kísérletek során, gondoljunk a pszichoanalízis szabad asszociációs módszerére, melynek esetében azáltal, hogy fogalmaink kapcsolatban állnak egymással elménkben, egyikről a másikra asszociálunk, és ezt nyelvileg reprezentáljuk. Ennek feltárása során az elsőre szabadnak, és érthetetlennek tűnő asszociációk megmutatják, hogy a páciens elméjében milyen fogalom milyen más fogalmakkal áll kapcsolatban, és így következtetni lehet azok tapasztalati eredetére.

Vagy mivel a fogalmi metaforák egyik leggyakoribb céltartománya az érzések és az érzelmek, a metaforák vizsgálata az érzelmi reakciók, érzelem megnyilvánítások, érzelemterminusok kutatásában is részt vállalhat.

Asszociatív kapcsolatokat kihasználhatnak olyan esetekben is, ahol szükséges az érzelmekre hatás, a szemléltetés, esetleg a manipuláció is, vagy a ferdítés, homályosság, olyan tartalmak megjelenítése, amelyeket nehéz nyelvileg explicitté tenni. Ennek tipikus területei a reklámok, illetve a politikai beszédek, kampányok. George Lakoff politikai nyelvben megjelenő metaforákkal kapcsolatos kutatását mutatja be a szerző Moral politics c. művében, valamint a Kereső Világon találhatunk egy rövid összefoglalást róla.

nora05.PNG

A marketingben és a reklámokban előszeretettel kihasznált metaforikus és metonimikus viszonyok vizsgálatáról olvashatunk például Horváth Dóra és Mitev Ariel Zoltán írásában.

Ahogy már korábban írtam, metaforák a szaknyelvekben is használatosak. A szaknyelvi metaforákat egyfelől az motiválja, hogy a gyorsan lezajló változások következtében nincs idő fokozatosan megszokni és megismerni az új jelenségeket, és azok bonyolult megnevezéseit, ezért „egyszerűbb” metaforikus kifejezéseket használnak rájuk, hogy így közelebb hozzák a megnevezés tárgyát, sőt gyakran a szaknyelv és a köznyelv közti átjárást is metaforák biztosítják.

Szaknyelvi metaforákkal kapcsolatban gondoljunk például az anatómiai szakterminológiára: ádámcsutka, dobhártya, fülkagyló, mellkas; vagy a számítástechnika egér, vírus, kukac szavaira. A szaknyelvi metaforák témakörét tárgyalja többek között Tolcsvai Nagy Gábor Kemény és puha, avagy metafora a szaknyelvben c. írása. (1989, In: Bíró Ágnes (szerk.): Szaknyelvi divatok. Gondolat Kiadó, Budapest.).

nora06.PNG

A metafora és a metonímia vizsgálata fontos fogódzó lehet a pragmatikai kutatásokban is. Erről olvashatunk például Bencze M. Ildikó A metonímia a kognitív pragmatikaelméletek tükrében c. cikkében, vagy Nemesi Attila László Az alakzatok kérdése a pragmatikában c. könyvében, illetve a pragmatika funkcionális kognitív megközelítésére ajánlom Tátrai Szilárd: Bevezetés a pragmatikába c. könyvét.

 

Falyuna Nóra a Károli Gáspár Református Egyetem MA hallgatója Terminológia mesterszakon. Emellett főbb irányultsága a kognitív nyelvészet, azon belül is különösen a fogalmi metaforák világa. Érdeklődési körében kiemelten fontos szerephez jut továbbá a nyelvfilozófia, illetve a pragmatika területe.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Így cenzúrázd az internetet

2014.02.26. 08:42 Szerző: Zoltán Varjú Címkék: internet cenzúra Twitter forradalom

Mikal Hem Kezdő diktátorok kézikönyve című művéből megtudhatjuk, miképp nyerhetünk 99.9%-al a választásokon, hogyan építsünk ki személyi kultuszt, vagy éppen teremtsünk saját építészeti irányzatot. De egy igazi diktátor ellenőrzi azt is, hogy milyen információhoz jut hozzá népe, amiről sajnálatos módon a kötet hallgat. Jó hírünk van a kedves olvasóknak, a dekadens nyugati világ kutatói a legszofisztikáltabb internetes cenzúrát tanulmányozva megírták a receptet!

480x.jpg

Abdelberi Chaabane és tsai az Inria kutatóintézetben a szír Telecomix hacker csapat által nyilvánosságra hozott adathalmazt elemezve mutatják be a Censorship in the Wild: Analyzing Web Filtering in Syria című tanulmányukban. A Technology Review-nak nyilatkozva Chaabane felhívja a figyelmet arra, hogy csupán a webforgalom 1%-át korlátozzák a hatóságok - ez arra utal, hogy ma már nem comme il faut csak úgy en block letiltani a netet, egy rendes elnyomó rendszer a kritikus pontokra összpontosít!

Their analysis of this data reveals some surprising facts. It turns out the Syrians were censoring only a small fraction of the traffic, less than 1 per cent. “The vast majority of requests is either allowed (93.28%) or denied due to network errors (5.37%),” say Chaabane and co.

But this 1 per cent shows exactly how Syrian authorities conducted censorship at that time. “We found that censorship is based on four main criteria: URL-based filtering, keyword-based filtering, destination IP address, and a custom category-based censorship,” say Chaabane and co.

The Syrians concentrated their URL-based filtering on instant messaging software such as Skype, which is heavily edited. And much of the blocked keywords and domains relate to political news content as well as video sharing and censorship-circumvention technologies.

658_001.jpg

Gary King és tsai időt, pénzt és energiát nem spórolva a legjobbakhoz fordultak, hogy elkészítsék Reverse Engineering Chinese Censorship through Randomized Experimentation and Participant Observation című tanulmányukat. A közösségi média ma már a mindennapok része, még a diktatúrákban is. Jászberényi Sándor a Budapest-Kairóban egy angol újságíróval beszélgetve döbben rá, hogy bizony a social media kikapcsolása csak ront a diktátorok helyzetén, különösen zavargások idején, hiszen feláll a gép elől a fiatalság és más, sokkal nehezebben követhető applikációk után néz:

"Ki csinálta a forradalmat?", kérdezem Davidet. "A kormányközeli média azt mondja, hogy az iszlamisták."

"Hazudnak. Nem az iszlamisták."

"Az ellenzék?"

"Az ellenzék tüntetést szervezett, nem forradalmat."

"Akkor ki?"

"A Twitter meg a Facebook", mondja David. És nem viccel.

[...] Az internet leállítása sosem látott tömegeket vitt ki az utcára, olyanokat, akik egyébként nem mentek volna ki. A rezsim lebecsülte az emberek információ iránti igényét. [...] El lehet venni egy embertől a szabad választásokat, a demokráciát, el lehet venni a szabadságjogainak nagy részét, de nem vehetik el a kommunikációs eszközeit, melyeket használ és ismer. Senki sem fog önként sötétségben maradni, elvágva mindentől és mindenkitől.

 

[...] Egy másik feltevés szerint a rendőrség a posztok és tweetek GPS adatait követve, valamint a közösségi médiát monitorozva csapott le csoportokra. Ezután a kormányellenes tüntetők a különböző oldalakon zárt csoportokat hoztak létre, melyekben nem tudják lenyomozni őket, illetve megugrott az olyan mobilappok népszerűsége is, melyek elrejtik a felhasználó aktuális pozícióját. A Hotspot Shield nevű alkalmazás törökországi letöltéseinek száma pl. 120.000-rel nőtt az elmúlt egy hétben.

 


download.jpg

 

Az egyiptomi helyzethez hasonló bonyodalmakat senki sem akar! King és tsai nem csupán a kínai közösségi médiát monitorozták, a felhasználókat bevonva végeztek vizsgálatokat és egy saját közösségi oldal felállításába is belevágtak, csak azért, hogy testközelből kapjanak információt a kínai hatóságok működéséről. Már maga a tanulmány absztraktja is impresszív!

Chinese government censorship of social media constitutes the largest coordinated selective suppression of human communication in recorded history. Although existing research on the subject has revealed a great deal, it is based on passive, observational methods, with well known inferential limitations. For example, these methods can reveal nothing about censorship that occurs before submissions are posted, such as via automated review which we show is used at two-thirds of all social media sites. We offer two approaches to overcome these limitations. For causal inferences, we conduct the first large scale experimental study of censorship by creating accounts on numerous social media sites spread throughout the country, submitting different randomly assigned types of social media texts, and detecting from a network of computers all over the world which types are censored. Then, for descriptive inferences, we supplement the current uncertain practice of conducting anonymous interviews with secret informants, by participant observation: we set up our own social media site in China, contract with Chinese firms to install the same censoring technologies as their existing sites, and -- with direct access to their software, documentation, and even customer service help desk support -- reverse engineer how it all works. Our results offer the first rigorous experimental support for the recent hypothesis that criticism of the state, its leaders, and their policies are routinely published, whereas posts about real world events with collective action potential are censored. We also extend the hypothesis by showing that it applies even to accusations of corruption by high-level officials and massive online-only protests, neither of which are censored. We also reveal for the first time the inner workings of the process of automated review, and as a result are able to reconcile conflicting accounts of keyword-based content filtering in the academic literature. We show that the Chinese government tolerates surprising levels of diversity in automated review technology, but still ensures a uniform outcome by post hoc censorship using huge numbers of human coders.

Jó tudni, hogy az ismertetett tanulmányok szabad hozzáférésűek, ezért nem csak saját cenzúránk felállításához, de akár annak kijátszásához is felhasználhatóak - jobb ha rögtön blokkoljuk a tudományos oldalakat hatalomra kerülésünk után!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Könyvajánló: The Theory That Would Not Die

2014.02.20. 08:00 Szerző: Zoltán Varjú Címkék: könyvajánló

A bayesiánus statisztika ma valahogy ott van a levegőben, a big data, data science és machine learning buzzwordök mellett egyre gyakrabban halljuk, hogy bayesian data analysis. Ennek tükrében érthető, hogy a szűk szakmán kívül is sokakat érdekel mit is fed ez a fogalom. Sharon Bertsch McGrayne nagyon deskriptív, de a Twitter korában túl hosszú című könyve a The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy betekintést nyújt a Bayes-tétel születésének körülményeibe és leírja a hihetetlen népszerűségéhez és sokoldalú alkalmazhatóságához vezető útját.

theory.jpg

A kötettel foglalkozó kritikák szeretik a szerző szemére vetni, hogy nem nagyon időzik el az elmélet matematikai hátterével, de szerintünk ez nem is baj, ui. erre ott van sok-sok remek szakkönyv. Azzal viszont egyet kell értenünk, hogy nem az átlagos olvasó a célközönség, hanem a motivált emberek. Ez alatt nem csak a statisztikusokat értjük, hanem azokat, akik pl. érdeklődtek már a spam-szűrők működése, vagy a szerzőség megállapításának kérdése iránt.

 

A könyvvel kapcsolatban egyedüli problémánk az, hogy színvonala nem egyenletes, s ez nem csak az egyes fejezetekre, hanem azok alrészeire is vonatkozik. Cserébe viszont tisztes iparos munka, kevesebb mint 300 oldalon átrágva magunkat átfogó képek kaphatunk a Bayes-tétel világáról és biztosak vagyunk abban, hogy lesznek akik mélyebben is meg akarnak majd ismerkedni a témával miután letették a könyvet - ennél többet egy ismeretterjesztő műtől nem is kell elvárni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Könyvajánló: The Information: A History, A Theory, A Flood

2014.02.19. 08:00 Szerző: Zoltán Varjú Címkék: könyvajánló információelmélet

Hogyan kapcsolódik össze az Oxford Dictionary, a telekommunikáció története és a Boole algebra az Enigma feltörésével, génjeinkkel és a kvantumfizikával? James Gleick The Information: A History, A Theory, A Flood című könyve megkísérli megválaszolni ezen kérdéseket.

theinformation.png

Az információelmélet valahogy sosem lett szexi, annak ellenére hogy átszövi életünket, a nyelvészettől a fizikán át a biológiáig használják. Ennek legfőbb oka, hogy túl sok mindennel függ össze és talán túl sokan értik is félre. Gleick roppant szórakoztató könyvben meséli el, hogyan is alakult ki a modern információelmélet és került kapcsolatba a legkülönbözőbb tudományterületekkel.  

 

Habár a könyv nagyon alapos, de szórakoztató is, ezért a maga 544 oldalával nem megterhelő. Megfelelő nyelvtudással akár 10-12 éves gyerek számára is érthető. Érezhető, hogy Gleick nagyon igyekezett emészthetővé tenni ezt a mellőzött területet, ezért Shannon mellett nem csak Babbage, Schrödinger, Watson és Crick neve tűnik fel, hanem pl.  McLuhan és Ong is. Mint a legtöbb ismeretterjesztő kötet, ez is inkább elgondolkodtat és segít meglátni az összefüggéseket a látszatra nagyon eltérő területek között - ugyanakkor semmi konkrétat nem tudunk meg elolvasása után az információelméletről!

pierce.jpgAki nem riad vissza egy kis matematikától (kb. elemi algebra és a logaritmus fogalmának ismerete) az a The Information elolvasása után, vagy inkább helyett, John R. Pierce An Introduction to Information Theory című rövid könyvecskéjéből sokkal többet tudhat meg a területről. 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Évadnyitó NLP meetup 2014. február 20-án

2014.02.18. 08:00 Szerző: Zoltán Varjú Címkék: meetup NLP meetup Montana magyarlanc

Évadnyitó meetupunkat február 20-án az új  Colabs-ben (1016 Budapest, Krisztina krt. 99.) tartjuk 18:00-tól. A részvétel ingyenes, de előzetes regisztrációhoz kötött.

logo9_final.jpg

Két izgalmas előadással várjuk a nyelvtechnológia iránt érdeklődőket! Görög György a Montana tanácsadója egy az entitáskinyerésen alapuló leletértelmezés és tanácsadás témájában hamarosan záruló projekttel kapcsolatos tapasztalataikról beszél majd. Akik keresnek jó Java alapú nyelvi eszközöket a magyar nyelvhez, azok feltétlenül nézzenek be hozzánk, hiszen a magyarlancról Vincze Veronika és Zsibrita János egy átfogó bemutatót fog tartani.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása