HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Emóciók vs. funkciószavak I. Egy kutatássorozat első lépése: Felcsigázzuk az érdeklődést

2015.07.13. 10:00 Szerző: Szabó Martina Katalin Címkék: nyelvészet szociálpszichológia pszichológia afázia névmások nyelvtechnológia emócióelemzés Pennebaker pszicholingvisztika funkciószavak

A jelen poszttal induló kutatássorozatunkhoz James W. Pennebaker The Secret Life of Pronouns című könyve adta az ötletet. A szerző angol nyelvű szövegeket vizsgál abból a szempontból, hogy vajon a funkciószavak használata milyen, eleddig rejtve maradt információkat árul el számunkra az adott nyelvhasználót illetően. Kíváncsiak voltunk, mi derül ki, ha a mindezeket a sajátságokat a magyarban is megnézzük.

Eredetileg azt szerettük volna megvizsgálni, hogy vajon találunk-e valamilyen szignifikáns összefüggést a magyar nyelvű szövegekben előforduló emóciószavak és a személyes névmások között. Pennebaker könyve azonban annyi izgalmas ötleteket adott, hogy végül úgy döntöttünk, egy egész kis kutatási projektet szentelünk a feladatnak, és mélyebben is beleássuk magunkat a témába.

Olvasóink tehát időről időre megismerkedhetnek majd a vizsgálati eredményeinkkel, s a jelen posztban - az izgalmak fokozása céljából - az ötletadó Pennebakerről lesz szó, valamint az emóciók, a személyiség, a nyelv és az agy izgalmas kapcsolatrendszerét tárgyaljuk részletesebben. 

Pennebaker 2011-ben publikált könyve, a The Secret Life of Pronouns több évtizednyi kutatómunka eredménye, amelyben a szociálpszichológus szerző többek között nyelvészekkel, számítógépes és marketinges szakemberekkel, valamint jogászokkal együtt vett részt. A vizsgálati sorozat egyik elméleti alapvetése azt volt, hogy az ún. funkciószavak, amelyek közé pl. a névmások, a névelők és a segédigék tartoznak, elárulnak bizonyos részleteket az emberi személyiségről, a gondolkodási sajátságokról, az érzelmi állapotról, illetve az adott személy emberi kapcsolatairól.

author.pngA funkciószavak az ún. tartalmas szavakkal állnak szemben. Ez utóbbiak ugyanis, ahogyan pl. a főnevek, a melléknevek, a számnevek vagy az igék, általában konvencionális alapon összeköthetőek a világ jelenségeivel - míg a funkciószavak nem. Amíg például az asztal vagy a séta hasonló képzeteket hoz létre az adott nyelv beszélőiben, addig az akkor vagy az ő jelölete rendkívül változatos lehet. A funkciószók szerepe ugyanis a tartalmas szavak közötti kapcsolatok megteremtése, illetve azok jelentéseinek árnyalása, módosítása. (A jelenségről további információt találni többek között itt.)  

Az alábbi táblázat tartalmazza a funkciószók típusait, valamint néhány példát mindegyikre az angol és a magyar nyelvből (vö. Lengyel 2000; Szita-Görbe 2010):

 

 

Kategória példák az angolból példák a magyarból
névmások I, she, it én, ő, az
névelők a, an, the a, az, egy
prepozíciók up, with, in, for -
névutók - fölé, mellett, nélkül, iránt
segédigék és segédszók is, don't, have fog, múlik, való, marad, volna
negáló elemek no, not, never ne, nem, soha
kötőszók but, and, because de, és, mert
kvantorok few, some, most néhány, sok, legtöbb
határozószók very, really kicsit, nagyon, eléggé

ob-py260_bkrvpr_dv_20111003134158.jpg

 

Pennebaker kutatócsoportjának a 90-es években sikerült létrehoznia az ún. LIWC programot (Linguistic Inquiry and Word Count), amely majd' 80 különböző, kézzel összeállított szótár alapján volt képes nagy mennyiségű szöveg elemzésére. Az eszköz segítségével a csoport számtalan szövegtípus nyelvi sajátságait térképezte fel azután, s a munkájuk eredményeképpen létrejött legfontosabb megállapításokat 2011-ben, az említett könyvben publikálták. 

A kutatás további figyelemre méltó hozadéka volt, hogy létrehoztak egy gyors személyiségelemző eszközt, amelyet bárki kipróbálhat az interneten keresztül egy szöveg bemásolása segítségével. A program természetesen angol nyelven készült, és ezen a linken érhető el.

De miért is irányítsuk figyelmünket a funkciószavakra a tartalomelemzésben? Miért ne csupán azokra a bizonyos tartalmas szavakra fókuszáljunk?

Pennebaker többek között azzal érvel, hogy hogy a 20 leggyakoribb előfordulású angol szó között kizárólag funkciószavakat találunk, s pusztán ez a húsz elem megközelítőleg a 30%-át teszi ki az angol nyelvi produktumoknak, az írott és a beszélt nyelvet illetően egyaránt. 

A Magyar Nemzeti Szövegtár (MNSZ) adatai alapján megnéztük, vajon mi a helyzet a magyar nyelvben. Az angolhoz hasonló eredményre jutottunk: tartalmas szót nem is találtunk a top 20-ban.

3.jpg

A jelenség további érdekes momentuma, hogy a nyelvhasználat során tudatosan alapvetően a tartalmas szavakra fókuszálunk, mind a produkció, mind az interpretáció folyamatában. Ez egyrészről azt jelenti, hogy amikor szövegeket alkotunk, kevésbé vagyunk megfontoltak a funkciószavak használatát illetően; inkább a közölni kívánt szemantikai tartalomra, így szükségképpen elsősorban a tartalmas szavakra koncentrálunk. Ugyanakkor a kommunikációnk során a funkciószó-használatunkkal tudattalanul is olyan információkat közlünk magunkról, mint például a nemünk, a korunk, a szociális viszonyaink vagy az aktuális érzelmi állapotunk - amelyeket esetleg egyáltalán nem is szerettünk volna a partner tudomására hozni. Az elmondottakon túl a funkciószavak "megbúvó" természete azt is eredményezi, hogy amikor szövegeket interpretálunk, a tartalmas szavakra koncentrálunk, azokra támaszkodva igyekszünk megérteni a közvetített tartalmat.  A funkciószavak mégis, mintegy tudat alatt hatnak ránk. Pennebaker Abraham Lincoln 1863-as, elementáris erővel ható beszédét hozza példaként, amelynek java része tulajdonképpen 14, több alkalommal ismételt funkciószóból állt.  

Azt mondja Pennebaker tehát, hogy funkciószó-használatunk az érzelmi állapotunkról is árulkodik. De hogyan lehetséges az, hogy ez a két faktor összefügg? Hol és hogyan kapcsolódhatnak össze ezek a faktorok az emberi agyban?

120px-limbic_lobe_animation_small.gif

A szerző az ún. Broca- és Wernicke-afázia példáján keresztül mutat rá az összefüggés természetére. Tekintsük mi is e jelenségeket részletesebben! 

Az alábbi egyszerű sematikus ábra az agyban található ún. Broca- és Wernicke-területek elhelyezkedését szemlélteti. 

tr_0108-gene-b_x220.jpg

 

A Broca-terület, amelyet felfedezője, Paul Broca után neveztek el, a bal homloklebenyen található, míg a Carl Wernicke után elnevezett Wernicke-terület a bal fali lebenyen helyezkedik el. Mindkét tudós orvos volt, és a 19. században, beszédprodukcióval és beszédértéssel kapcsolatos defektusokon keresztül ismerték fel a tárgyalt agyi területek jelentőségét (további információért l. pl. eztezt és ezt).

Broca az 1860-as években egy egész sorozat tanulmányt publikált arról, hogy a később róla elnevezett terület károsodása következtében gyakorta fájdalmasan lassú, és elemeiben össze nem függő beszéd alakul ki a betegeknél. Szigorúbban fogalmazva azt mondhatjuk, hogy a terület sérülése a funkciószavak megfelelő használatának képességét (is) veszélyezteti. Súlyos esetben akár drámaian - szinte kizárólag főnevekre -redukálódik a szókincs. Nézzünk egy rövid részletet egy Broca-afáziában szenvedő beteg beszédéből (vö. Bánréti 2006)!

 Kérdező: Hogy került a kórházba?

Vizsgálati személy: Igen ... hétfőn ... öö ... apa és Piri (a beteg neve) ... és apa ... kórházba. Két ..... orvos, és ... harminc perc ... és ... igen ... és ... kórház. És ööö szerdán ekkor... kilenc órakor ... és ... harminc perc ... csütörtök ... tíz óra, orvosok. Két orvos ..... és fogak. Igen ... így'

A fenti részlet jól szemlélteti a Bánréti (2006) által említett alapvető tüneteket, úgymint a mondatrészleteket produkáló, el-elakadó, töredezett beszédet, amelyet a szótalálási nehézségek, a gyakran elhagyott funkciószavak, valamint az elhagyott toldalékok jellemeznek. 

Az ún. Wernicke-terület károsodása Broca-afáziától igen eltérő nyelvi tüneteket produkál. Az ebben az agyi rendellenességben szenvedőkre jellemző a rendkívüli szóbőség, beszédük grammatikailag helyes, de tartalmatlan. Megfigyelhető, hogy a betegeknek szótalálási problémái vannak, egészen egyszerű főnevek és igék sem jutnak az eszükbe, ezért azokat gyakran más, oda nem illő, sőt kitalált szavakkal helyettesítik. A tartalmas szavakkal vannak tehát problémáik, ugyanakkor a funkciószavakat gond nélkül, megfelelő módon használják. 

A következő részlet egy Wernicke-afáziás magyar betegtől származik, Herman József gyűjtéséből (vö. Pinker 1999): 

Vizsgálati személy: ...eltávottam rajta így sikantiá voltunk úgyhogy nem tudtam eztet kiváltani hanem azon gondolkodtam hogy hátha lenne davivi hanem azt mondtam ippen be hogy úgy kell tenni hogy megint el tudtam fele... szóval csak aztat szerettem volna hogy így a gyerek megvan hanem szállítjuk nekik hogy mondhatját táguttuk egymást.

Kérdező: Hány éves a bácsi gyereke?

Vizsgálati személy: Hát nekem a két epretek huszon dehogy huszon hanem harm... negyven ötvenöt tül van ez az árpa...

A Broca-terület, amely tehát a funkciószavak használatának képességével szoros összefüggést mutat, a frontális agyi lebenyben található. Ez az agyi terület azonban több más képességet is irányít, és közülük számos a szociális jellegű képesség és készség. A frontális lebenyhez köthető például a különböző érzelmek kifejezési, sőt palástolási képessége, de több más, szociális kapcsolatainkban fontos szerepet játszó kompetencia is itt lokalizálódik. És ami számunkra még izgalmasabbá teszi a problémakört, az az, hogy az arckifejezések értelmezésének képessége is ehhez az agyi területhez köthető, korábbi posztunkban pedig épp arra igyekeztünk rávilágítani, hogy milyen párhuzamok találhatóak az arcon megjelenő és a szövegszintű emóciókifejezések kontextusbeli megértése között! 

A frontális lebenynek a szociális képességekben való kimagasló szerepét mutatja Phineas P. Gage (1823-1860) híressé vált, tragikus esete. A férfi mérnökként az új-angliai vasúttársaságnál a pályamunkások csoportvezetője volt, azonban egy 1848-ban bekövetkezett balesetben egy hosszú vasrúd fúródott a fejébe, amely az agyának a bal frontális lebenyét nagy mértékben elpusztította.

i-b15524a44bd4ae497b9a8f348dd2b076-gage3.jpg

A család, és a többi, róla gondoskodó legnagyobb meglepetésére azonban Gage még a tragédia évében felépült. Ugyanakkor, a baleset teljesen átformálta a férfi személyiségét és viselkedését. A korábban figyelmes, kedves, pontos és precíz műszakvezető a tragédia következtében fegyelmezetlen, trágár, figyelmetlen, agresszív, sőt perverz emberré vált, ahogyan arról az esetet publikáló amerikai orvos, John Martyn Harlow beszámolt. Gage barátai egyenesen úgy találták, hogy a férfi “többé már nem Gage”. Harlow így ír megfigyeléseiről:

His contractors, who regarded him as the most efficient and capable foreman in their employ previous to his injury, considered the change in his mind so marked that they could not give him his place again. He is fitful, irreverent, indulging at times in the grossest profanity (which was not previously his custom), manifesting but little deference for his fellows, impatient of restraint of advice when it conflicts with his desires, at times pertinaciously obstinent, yet capricious and vacillating, devising many plans of future operation, which are no sooner arranged than they are abandoned in turn for others appearing more feasible. In this regard, his mind was radically changed, so decidedly that his friends and acquaintances said he was "no longer Gage".

 1b9d43bd350aeebac6e46027b943764375fbb4228215db0686ecdcd339a723f1.jpg

 

Pennebaker amellett érvel, hogy amennyiben a személyiség és a szociális viselkedés szorosan kapcsolódik a frontális lebenyhez, nem meglepő, ha azt tételezzük, hogy magának a frontális lebenyben levő nyelvi központnak, a Broca-területnek is kapcsolata kell, hogy legyen a személyiséggel és a szociális viselkedéssel. Pennebaker rámutat, hogy a funkciószavak megfelelő használatához - amelyért tehát a Borca-terület felel - szociális képességek, illetve készségek szükségesek. Ahhoz például, hogy névmásokat megfelelően használhassunk, tisztában kell lennünk azzal, hogy a kommunikációs partnerünk képes megtalálni azok referensét a szövegben vagy a szövegen kívüli világban; így az alábbi mondat esetében:

Nem tudom, hova tehette, de hozd akkor azt a másikat onnan.

Bár a példában alig találni tartalmas szót, az ilyen és ehhez hasonló megnyilatkozásokat gond nélkül produkáljuk és interpretáljuk mindennapi kommunikációnkban - feltéve persze, ha egészséges Broca-területtel rendelkezünk.

A tárgyalt összefüggéseket támasztják alá azok a jelenségek is, miszerint bizonyos funkciószavak használati sajátságai eltérnek a férfiak és a nők, továbbá különböző korosztályok között (pl. a férfiak több névelőt, míg a nők több egyes szám első személyű személyes névmást használnak). Mindemellett a lelkiállapot is jelentősen befolyásolja a funkciószavak használatát. A Kasseli Egyetem kutatói által, Dr. Johannes Zimmerman vezetésével végzett kutatás eredményei szerint például azok az emberek, akik gyakrabban használják az egyes szám első személyű - vagyis a saját magára utaló - személyes névmásokat (én, magam, engem stb.), nagyobb valószínűséggel hajlamosabbak a depresszióra vagy szenvednek depresszióban, továbbá több nehézségük van interperszonális kapcsolataikban is, mint azoknak, akik megnyilatkozásaikban a többes szám első személyű (mi, magunkat stb.) személyes névmásokat részesítik előnyben (a kutatásról részletesebben l. itt).

 

brain_map.jpg

 

Az e poszttal indított kutatássorozatunk célja, hogy feltérképezzük, milyen kapcsolatok mutatkoznak a funkciószó- használat és az ember érzelmi állapota, szociális státusza, kora, neme és egyéb esetleges tulajdonságai között. Első eredményeinkről rövidesen beszámolunk.

note-comingsoon.jpg

IRODALOM és FORRÁSOK

Bánréti Zoltán 2006. Neurolingvisztika. In Kiefer-Siptár (szerk): Magyar nyelv.  Budapest, Akadémiai kiadó – Kluwer. 653-725.

Hoffmann Ildikó 2007. Nyelv, beszéd és demencia. Philosophiae Doctores 56. Budapest, Akadémia Kiadó.

Hoffmann Ildikó-Németh Dezső 2006. Neurolingvisztikai tanulmányok. Szeged, JGYTF Kiadó.

Lengyel Klára 2000. A segédigék és származékaik. In Keszler Borbála (szerk.): Magyar grammatika. Budapest, Nemzeti Tankönyvkiadó. 252-258.

Pennebaker, James W.  2011. The Secret Life of Pronouns: What Our Words Say About Us. New York, Bloomsbury Publishing.

Pinker, S. 1999. A nyelvi ösztön. Budapest, Typotex.

Szita Szilvia-Görbe Tamás 2010. Gyakorló magyar nyelvtan – A Practical Hungarian Grammar. Budapest, Akadémiai Kiadó.

Magyar Nemzeti Szövegtár (MNSZ) [http://corpus.nytud.hu/mnsz/]

[http://www.theguardian.com/science/blog/2010/nov/05/phineas-gage-head-personality]

[http://www.nyest.hu/hirek/nyelvtani-szofajok-az-mti-nel]

[http://index.hu/tudomany/gesch/]

[http://analyzewords.com/]

[http://www.nytud.hu/oszt/neuro/banreti/publ/banretikezi.pdf]

[http://nemettolmacs.blogspot.hu/2008/05/broca-s-wernicke-afzirl.html]

[http://life.ma/eletmod/betegsegek/8845-depresszios-lehet-aki-sokat-beszel-magarol/]

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr477595354

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása