HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Nekünk elmélet kell!

2013.06.26. 08:00 Szerző: Zoltán Varjú Címkék: szociálpszichológia evolúciós pszichológia metafora big data Miller kognitív nyelvészet szentimentelemzés emócióelemzés Pennebaker pszicholingvisztika Big Five Kövecses

Chris Anderson The End of Theory cikke szerint a big data önmagában szükségtelenné teszi az elméleteket.  Mark Graham a Guardian hasábjain remekül érvelt amellett, hogy nem spórolható meg a rendes tudományos munka még a nagy adatokkal sem. Az adatokat valahogy elemezni kell, az elemzés eredményét pedig értelmezni szoktuk. A nyelvtechnológiában még inkább szükségünk van elméletekre ehhez, hiszen gyakran a nyelvi adatokból szeretnénk következtetni valami másra, pl. a felhasználó preferenciáira, várható viselkedésére, az általa közölt információ megbízhatóságára stb. Most röviden áttekintjük a nyelvtechnológiára alapozott vizsgálatok értelmezése terén legnagyobb hatást gyakorló három elméletet, melyek közös pontja, a kognitív tudomány (vagy megismeréstudomány). 

pennebaker.jpg

James W. Pennebaker szociálpszichológus The Secret Life of Pronouns című könyve ma az egyik legnépszerűbb mű a szentimentelemzéssel foglalkozók körében. Pennebaker kutatásainak középpontjában az ún. funkciószavak állnak, melyek a nyelvtani, szerkezeti viszonyok jelölésére szolgálnak (pl. névmások, névelők, kötőszavak stb.) szemben a tartalomszavakkal (pl. főnevek, igék stb.) A nyelvtechnológiában alkalmazott szózsák modellben a funkciószavakat szeretjük stopszó listára tenni és kiszűrni, mivel túl sok "zajt" keltenek. Ellenben ezek használata sokat elárul a beszélő személyiségéről, vagy éppen arról, hogy igazat mond-e. Pennebaker elméletét sokan próbálják átültetni a gyakorlatba. Randioldalakon a profilok őszinteségét rangsorolják vele, egészségügyben a diagnosztikát segítik és terápiás céllal is bevetik. A SmogFarm startup pedig általános szentimentelemzésre és felhasználói bázis szegmentálására (a demográfiai adatok személyiségjegyekkel történő kiegészítésére) használja Pennebaker elméletét, aki nem mellesleg a cég tanácsadója is. Állandó időhiánnyal küzdő olvasóinknak ajánljuk Pennebaker Scientific American Mind&Brian Magazine interjúját és az alábbi TED előadását.

miller.jpg

Geoffrey Miller evolúciós pszichológus szakterületét a manapság divatos viselkedés közgazdaságtanra alkalmazta. Spent: Sex, Evolution, and Consumer Behavior című könyve a konzumerizmus és a kapitalizmus ötletes bírálatát adja egy pszichológus szemszögéből. Miller szerint habár a marketing pszichológiai tankönyvek elavult elméletekre hivatkoznak (pl. Maslow piramisára) a gyakorlat azt mutatja, a reklámok az evolúció során kialakult öt nagy személyiségvonást (Big Five) veszik célba. Ennek oka egyszerűen az, hogy a szakemberek ösztönösen érzik ezen személyiségvonásokat, hiszen az evolúció során agyunk arra rendezkedett be, hogy nagy pontossággal azonosítsuk ezeket.

Kísérletek igazolták, hogy az emberek viszonylag nagy pontossággal képesek valakit besorolni az öt nagy jegy egyikébe. Viszonylag egyszerű és olcsó pszichológiai teszttel bárkit be lehet sorolni az egyik személyiségvonásba. Az egyes kategóriák - emocionalitás/neurocitás, extraverzió, nyitottság/intellektus, barátságosság/együttműködés és lelkiismeretesség - sokkal jobban korrelálnak a fogyasztási szokásokkal, mint a demográfiai jellemzők (kor, nem, lakóhely, státusz) s ezért jó kiegészítő adatai lehetnek egy marketingkampánynak. Ahogyan arról már a Tweet a lélek tükre(?) című posztunkban beszámoltunk, a nyelvi viselkedést és azon belül is a közösségi média nyelvhasználatát elemezve is elvégezhető a  vonások elemzése. Az ún. szegmentálással, azaz a célcsoportok különböző kritériumok szerinti osztályozásával foglalkozó cégek körében egyre népszerűbb ez az elmélet. Érdemes elolvasni Miller könyvét, kedvcsinálónak pedig TED előadását ajánljuk.

kovecses.jpg

A metaforák átszövik nyelvünket, nem csak az irodalmi nyelvhasználatban vagy az ünnepi beszédekben használunk metaforákat vagy metaforikus alakzatokat. George Lakoff és Mark Johnson Metaphors We Live By című könyvükben fektették le a kognitív nyelvészet alapjait. Központi tézisük szerint a metafora segít egy elvontabb dolgot megérteni azzal, hogy leképezi azt egy konkrétabb esetre. Pl. a SZERELEM UTAZÁS, vagy a VITA HARC esetében a forrástartomány egy konkrét dolog, amit egy elvont, szellemi, lelki tevékenységgel állítunk párhuzamba. Pl. "kapcsolatunk új irányt vett", vagy "érveivel megsemmisítette ellenfelét". A metafora megértése nélkül lehetetlen a teljesen automatikus nyelvtechnológia. A DARPA Metaphor projektje megpróbálja listázni a forrás és céltartományokat, valamint feltérképezni a közöttük lévő szisztematikus viszonyokat. Ettől várják azt, hogy a szövegek automatikus elemzése során detektálni tudják a bűnözők és terroristák titkos kódjait (pl. az elnök nagy ember, a merénylet pedig ajándék néven szerepelhet összeesküvők levélváltásában). A metafora és a kognitív nyelvészet egyik legjelentősebb kutatója Kövecses Zoltán, az ELTE professzora, írta A metafora című lebilincselő bevezető tankönyvet (ami eredetileg angolul jelent meg az Oxford University Press gondozásában). 

Az ipar számára a metafora megértése elsősorban a szarkazmus és a képletes beszéd felismerése miatt fontos. A szentimentelemzés területén gyakran okoz kellemetlen meglepetéseket, hogy egy szarkasztikus megjegyzést - pl. "Na ezt jól megcsinálta a cég!" - pozitívan értékelnek az algoritmusok, pusztán a bennük előforduló szavak miatt. A hírelemzés során is sokszor okoznak gondot a metaforák és a politikai PR áldozatául esett kifejezések értelmezése (pl. szárnyal a tőzsde, kemény landolás, megszorítás, reform, kiigazítás).

A Nyelv és Tudomány Jó a karosszériád! - avagy hol terem a metafora? című cikke röviden, de ugyanakkor alaposan összefoglalja a kognitív metafora elmélet alapjait. Az alábbi videóban maga az "iskola alapító", Lakoff meséli el, hogyan indult el kutatási programja.

Fontos megjegyezni, hogy a nyelvi adatok sem önmagukban, sem más adatokkal kiegészítve nem lennének képesek a fenti elméletek kiváltására. További érdekesség, hogy mindegyik kutatási irányzat harminc-negyven éve indult mint haszontalan bölcsészet és csak az utóbbi két-három évben vetették be őket alkalmazott és ipari kutatásokban. Ezen területek hazai művelői ténylegesen ott vannak a világ élvonalában, neves szaklapokban publikálnak, nagy tudományos kiadók adják ki könyveiket és nemzetközi kutatásokban vesznek részt. A magyar innovációs potenciált veszélyezteti, aki nem ismeri fel hasznosságukat és kiaknázatlanul hagyja képességeiket.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr155375275

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása