HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

QWERTY - ahogy mi látjuk

2015.08.10. 16:40 Szerző: Anna Regeni Címkék: szentimentelemzés emócióelemzés Precognox Labs QWERTY-hatás QWERTY billentyűzet

Az előző a QWERTY-hatással foglalkozó posztunkban ígértük, hogy ez a poszt a mi vizsgálatunk eredményeit fogja röviden összefoglalni. (Hogyan befolyásolja a gondolkodásunkat a mindennapi számítógép-használat? A QWERTY-hatás)typing-speed.jpg

A QWERTY-hatás

A QWERTY-hatás Casasanto és Jasmin által megalkotott kifejezés, melyet saját vizsgálatukban sikerült többször és több nyelven is kimutatniuk. (The QWERTY Effect: How typing shapes the meanings of words.” By Kyle Jasmin and Daniel Casasanto Psychonomic Bulletin & Review Psychon Bull Rev 19.3 (2012): 499-504. Web.)

Mások is tettek kísérleteket e hatás kimutatására, azonban idáig nem sikerült reprodukálni C&J eredményeit(QWERTY: Failure to replicate, The QWERTY effect).

Ezen felbuzdulva úgy döntöttünk, hogy mi is készítünk egy, ha nem is mindenben a tudományos normák szerinti felmérést, hogy vajon magyarban kimutatható-e a hatás. Mint már a korábbi posztban említettük, a magyar billentyűzet azért is érdekes ebben a dologban, mert nálunk éppen megfordulnak az arányok és több betűt bitorol a jobb oldal, mint a bal. Ez azért fontos, mert Casasantóék egyik, a QWERTY-hatást magyarázó elképzelése azon az alapon nyugszik, hogy azért részesítjük előnyben az inkább “jobb oldali” (több, a jobb oldalról származó betűt tartalmazó) szavakat, mert azon az oldalon kevesebb lehetőség közül kell választanunk, így gyorsabban és folyamatosabban tudjuk gépelni a szavakat, ez a fizikai sikerélmény pedig jó érzést vált ki bennünk. (Ping, R. M., S. Dhillon, and S. L. Beilock. "Reach For What You Like: The Body's Role in Shaping Preferences." Emotion Review 1.2 (2009): 140-50. Web.)

Az az állítás, hogy a könnyű dolgok pozitív érzetet keltenek, egyes kutatócsoportok szerint nem minden esetben állja meg a helyét. Casasantóék említenek egy olyan kutatást, ahol ezt a könnyű - pozitív társítást sikerül módosítani azáltal, hogy előzetesen megmondják, ha könnyűnek érzik a feladatot, az alacsonyabb IQ-ra utal. (Brinol, P., R. E. Petty, and Z. L. Tormala. "The Malleable Meaning of Subjective Ease." Psychological Science 17.3 (2006): 200-06. Web.)

Mindenesetre szerintem azt elhihetjük, hogy a gépelés esetében alapvetően akkor vagyunk boldogok, ha gyorsan megy. Ezen kívül C&J végeztek olyan RT (reaction time, vagy reakcióidő) kísérleteket, ahol kimutatták, hogy a jobb oldalról több betűt tartalmazó szavakat átlagosan gyorsabban tudják begépelni a kísérleti személyek.(A jobb oldal a kísérletvégzés nyelvén a kevesebb betűt tartalmazó volt, ezen kívül pedig az emberek nagy többsége jobb kezes, vagyis ezzel a kezükkel általában ügyesebbek is.)

 

Casasantóéknak kijött egy enyhe pozitív hatás, ami az ő összes kutatásukban szignifikáns lett. Az enyhe pozitív hatás annyit jelent, hogy a több jobb oldalról származó betűt tartalmazó szavakat pozitívabbnak értékeljük, mint a bal oldalról többet tartalmazó szavakat.

Casasantóék egy későbbi kutatása szerint ez még a balkezeseknél is így van, erre pedig úgy jöttek rá, hogy közben a hipotézisük megdőlt, legalább is német nyelven, mivel ott a jobb és a bal oldalon is ugyanannyi betű található. Erre azt a magyarázatot találták, hogy akkor a domináns oldali preferencia az, ami a qwerty-hatást magyarázza. Ugyanakkor a balkezeseknél is kimutatható a RSA, így aztán elveszítettük a fonalat, hogy tulajdonképpen mi az állítás és miért hívják QWERTY-hatásnak.

Saját kutatás eredményei

Ami a mi kutatásunkat illeti, a menetrend a következő volt:

A már meglévő emóció- és szentiment szótárainkból, ezentúl a wiki szótárunkból (ami a SZTAKI magyar wikipedia dumpjából általunk generált szógyakorisági tábla) válogattuk össze a szavakat, miután az eredeti (jobb - pozitív, bal - negatív) kezességi értékeket egyenként kiszámítottuk hozzájuk. Ezután kerestünk néhány, a 60-as évek után keletkezett szót is, mivel C&J cikkében az áll, hogy ezeknél a szavaknál erősebb a hatás. Ezeket a szavakat az Édes Anyanyelvünk c. folyóirat “Új szavak, kifejezések” rovatából gyűjtöttük. Ezeket a szavakat összesítve összesen 53 szóval folyt a vizsgálat.

Az olyan szavaknál, ahol volt valencia vagy szentiment érték, kíváncsiak voltunk, hogy mi történik akkor, ha a kezesség a valencia ellenében van, vagy hogyha azzal megegyezik. Bővebben ez annyit jelent, hogy ha például volt egy pozitív valenciájú szó, (pl.: humor) ami több betűt tartalmazott a jobb, mint a bal oldalról, akkor ezt neveztük kongruensnek, mivel a valencia és a kezesség is “jó” volt. Ugyanígy, inkongruens szóról akkor beszélünk, ha a valencia és a kezesség ellentétes értékűek, vagyis egy pozitív jelentésű szó például több betűt tartalmaz a bal oldalról, mint a jobbról. A kérdőívben ezeket a szavakat kellett értékelniük a kitöltőknek egy 10-es skálán, kellemesség alapján. A kérdés - amennyire csak lehetett - általánosan volt megfogalmazva, hogy például ne fordítsanak különös figyelmet arra, hogy kifejezetten gépelni szeretik-e ezeket a szavakat, hiszen C&J munkája szerint ez a hatás olvasáskor is kimutatható, ugyanis gyakorlatilag egy enyhe jelentésmódosulásról van szó.

 

A kérdőívet végül 501-en töltötték ki, ebből az adathalmazból készítettük el a statisztikai elemzéseket. Az adatokra illesztett lineáris modellek illetve általánosított lineáris modellek nem támasztották alá, hogy létezne QWERTY-hatás magyar nyelven. Ahogy az alábbi ábrán is látható, nem találtunk kapcsolatot az RSA (right side advantage) és a valencia között.  Emiatt nem sikerült kimutatnunk azt sem, hogy a magyarban megfordulna a hatás.

rsa_vs_valence.png

 

A szavaknak azonban ismertük a szentiment- és emócióértékeit és sikerült kimutatnunk, hogy ezeknek szignifikáns hatása van a szavak kellemességére.

Az alábbi két ábrán látható, hogy a negatív és a pozitív jelentésű szavak szépen kettéválnak, ugyanakkor az RSA-val nincs összefüggés. Ugyanis a feltételezett kapcsolat természete szerint azt várnánk, hogy inkongruens esetben az RSA hatása gyengítse a szentiment illetve az emóció hatását (vagy a fordított hatás jegyében erősítse). Ezzel szemben az RSA-nek nincs hatása a szó kellemességének megítélésére, csak az emóciónak és a szentimentnek.

rsa_vs_valence_congruent_words.png

rsa_vs_valence_incongruent_words.png

Tehát az aszimmetrikus elrendezés kutatásunkban nem befolyásolta a szavak kellemességét. Erre azonban Casasanto & Jasmin is ráébredtek, ahogy azt fentebb már említettük.

Számukra ez azt bizonyítja, hogy másik hipotézisük - miszerint a legtöbb ember jobbkezes és emiatt erre a kezére ügyesebb is, így ezen az oldalon gyorsabban és folyamatosabban gépel, ami pozitív jelentésárnyalatot adhat a szavaknak - megállja a helyét.

Mi nem egészen gondoljuk így, de mint mondtuk, a mi kutatásunk kisebb kaliberű volt, mint az övék, ugyanakkor a hatás robosztusságáról nem tudunk beszámolni, csak arról, hogy mi nem találtuk meg.



Problémák

Egyéb kérdések is felmerülnek, mint a LanguageLogon több hozzászóló által is említett probléma: nagyon kevesen vannak olyanok, akik képzettek vakonírásban, vagyis kevesen használják “ideálisan” a qwerty billentyűzetet . Ez maga után vonja, hogy van, aki egy ujjal nyomogatja a klaviatúrát, hozzásegít a másik kezével az egyik oldal nyomogatásához és így tovább. Egyszóval nem biztos, hogy a valóságban létezik, vagy legalább is éles határ lenne a Casasantóék által említett TGB vonal. Márpedig ez a határvonal-kérdés eléggé fontos, hiszen az aszimmetria ettől a TGB vonaltól függ, ha az első elkepzelésüket is számításba akarjuk venni, hiszen valójában az eredeti hipotézisük csak a német nyelvre dőlt meg. Mindazonáltal a határvonal a német esetében is fontos, mert jobb kézzel a konvenció szerint a TGB vonaltól jobbra elhelyezkedő betűket gépeljük,ha viszont ez a valóságban nincs így, akkor tulajdonképpen mi alapján is soroljuk be a szavakat jobbkezes illetve balkezes csoportokba?

Babanevek

Ezektől az eredményekről egy pillanatra elvonatkoztatva Casasantóék egy további kutatásában kimutatott babanév-eltolódási tendenciát mi is felfedezni vélünk.

kepernyofoto_2015-08-10_16_01_04.png

(A fenti ábra Casasantóék cikkéből származik: Casasanto, D., Jasmin, K., Brookshire, G. & Gijssels, T. "The QWERTY Effect: How typing shapes word meanings and baby names". In P. Bello, M. Guarini, M. McShane, & B. Scassellati (Eds.), Proceedings of the 36th Annual Conference of the Cognitive Science Society. Austin, TX: Cognitive Science Society, 2014.)

A jelenség egy kicsit részletezve annyiból áll, hogy a névadási szokások az elmúlt 50 év alatt az olyan nevek felé tolódtak el, melyek több, a jobb oldalról származó betűt tartalmaznak. Ez ugyanakkor lehet, hogy nem a számítógép (értsd: billentyűzet) elterjedésének, hanem egy ciklikus tendencia egyik tipikus szakaszának tudható be. Ezt az elképzelést a Language Logon szépen végig is vezették, akit érdekel olvassa el: QWERTY again. Túl az ebben a posztban említett aggályokon, azért sem túl meggyőző ez az elképzelés a névadásról, mert az aszimmetria nem vonatkozik minden nyelvre, így aztán nem is adhatják azt a magyarázatot, hogy ez az egész jelenség a QWERTY-billentyűzetnek tudható be, hiszen jobbkezes emberek a QWERTY előtt is léteztek. Akkor viszont sokkal logikusabb magyarázatnak tűnik a ciklikusság.

 

Az alábbi ábrán látható a mi eredményünk, ez csupán a 2000-2014 közötti időszakról szól. Fontos megjegyeznünk, hogy mi is összevontunk a fiú és lányneveket az ábránkon. A grafikon alapjául a Keresztnevek Tára utónév statisztikája szolgált.

Igazából itt is látszik egy lefelé ívelő tendencia kezdete 2013 körültől 2015 felé közeledve, ami esetleg utalhat a ciklikusságra.

rplot.png

Van egy olyan enyhe utóíze az egész Casasanto-féle kutatásnak számunkra, hogy nem állítottak semmit, de azt bebizonyították. A kiinduló hipotézist a kutatás közben megváltoztatni alapból nem túl szép dolog és ezek után valami olyan eredményre jutni, aminek semmi köze a billentyűzethez, kissé furcsa.

 

Bármi is legyen az igazság, a QWERTY-leosztást sok szempontból megnézték már és ha ez a végeredmény nem is adott megerősítő eredményt a QWERTY-hatás létezésére vonatkozóan, ez is egy eredmény, amit hasznos lehet prezentálni.

 

Ha valaki biztosra akar menni, hogy a gépelési szokása miatt, vagy csupán azért, mert jobbkezes, nehogy pozitívabbnak érzékelje például a ‘killing’ szót, annak itt egy új alternatíva: BeeRaider(ezt még nem teszteltük :))

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr647696436

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása