HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Egyre individualistább a nyelv?

2013.08.22. 08:00 Szerző: Zoltán Varjú Címkék: szociálpszichológia Google Google Ngram culuromics

Patricia Greenfield a UCLA szociálpszichológusa The Changing Psychology of Culture From 1800 Through 2000 (sajnos nem szabad hozzáférésű) című tanulmányában a Google Ngram Viewer segítségével vizsgálta, hogy az individualizmusra ill. a kollektivizmusra jellemző szavak gyakorisága miképp változott 1800 és 2000 között. A kutató azt találta, hogy az amerikai angolban az individualizmusra jellemző szavak gyakorisága növekszik. További elemzésekkel szeretné megvizsgálni, hogy a brit angol, francia, spanyol és kínai Ngram korpuszokban is megfigyelhető-e hasonló jelenség. Mielőtt kitérnénk arra, mennyire lehet megalapozott egy ilyen vizsgálat, vessünk egy pillantást néhány példára Greenfield tanulmányából.

  • Kötelesség (obliged) vs választás (choose)

2013-08-09 09.59.50.png

  • Adni (give) vs kapni (get)

2013-08-09 09.59.58.png

  • Engedelmesség (obedience) - tekintély (authority) - valahová tartozik (belong) - imádkozik (pray)

2013-08-09 10.00.05.png

  • Egyén/egyéni (individual) - én (self) - egyedi (unique) - gyerek (child)

2013-08-09 09.59.38.png

Greenfield arra a megállapításra jutott, hogy a városiasodás és a modern életforma megjelenésével egyre individualistább lett a nyelvhasználat és a társadalom is. De következik-e bármi is egy szó vagy kifejezés gyakoriságából? Egy korábbi posztunkban már foglalkoztunk azzal a kérdéssel, hogy az Ngram Viewer segítségével tényleg megállapítható-e, hogy az emberek egyre individualistábbak, vagy egyáltalán van-e összefüggés a gyakoriság és a való világ között. Kedvenc példánk erre:

Az ún. flogiszton-elmélet a 17. és 18. században nagyon népszerű volt az égés magyarázatára míg Lavoisier meg nem cáfolta. A modern kategóriaelmélet megjelenését 1942-re datálják, de maga az elnevezés az 1960-as évekig nem terjedt el. Ugyanakkor a kategóriaelmélet tárgyalása során egészen a 19. században megjelenő algebrai geometriáig szokása visszamenni. Nézzük meg miképp alakul a "phlogiston theory" és a "category theory" kifejezések ngram-ja:

ngram03_1_1.png

A flogiszton-elmélet fontosabb lenne a kategóriaelméletnél? Fektessünk flogisztonnal foglalkozó startupba? Akik ismerik a filozófiatörténetet tudják, hogy az említésgyakoriság fokozatos emelkedésének oka egyszerű; a tudományfilozófusok egyik kedvenc példájával állunk szembe. A kategóriaelmélet hiába az egyik legfontosabb kutatási terület napjainkban (főbb "felhasználási területei" mint például a matematika alapjai, a kvantumfizika matematikai modellezése, kompozícionális-disztribúciós jelentéselmélet, kvantumszámítógépek, probabilisztikus programozás, bioinformatika tkp. lefedik a leginnovatívabb kutatási irányokat) ennek ellenére nagyon alacsony a frekvenciája.

Az individualista nyelvhasználat egyik legelemibb esetének szoktuk tekinteni, ha valaki sokat hivatkozik magára. "Én úgy gondolom, hogy...", "Azt hiszem...", "Szerintem..." stb. A többes szám használatát pedig a kollektivizmus jelének tartjuk. Azonban ahogy Pennebaker is kimutatta, a mi (angolban we, magyarban ez gyakran lemarad és a többes szám utal rá) legalább négy jelentésben használatos:

  1. (Mi) meg fogjuk oldani.
  2. (Mi) megtudjuk ezt csinálni holnapra?
  3. (Mi) sokkal jobbak vagyunk náluk.
  4. Ezt a sikert mi magyarok közösen értük el.

A fentiek közül az 1. pont az, ami az igazi "kollektív mi" értelemben használatos. A 2. pont lehet egy főnök kérdése a beosztottak felé, amiben a többes szám használata félrevezető, hiszen a beosztottak dolgoznak a feladaton. A 3.-ban a "mi" a két csoport közötti különbségtétel hangsúlyozását szolgálja. A 4. pont a politikára jellemző, gyakran változó hatókörű "mi" egyik példája.

Nem szeretnénk cáfolni Greenfield és a hasonló módszertannal kutató tudósok munkáját, csupán arra szeretnénk felhívni a figyelmet, hogy a puszta gyakorisági adatokon túl más információkat is figyelembe kell venni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr905453403

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

mikulasg 2013.08.27. 14:41:51

Kétféle individualizmus van az újabb kutatások szerint. Egyszerűen fogalmazva: a saját csapatra való büszkeség, ill. a javak elosztásának igénye. A fenti anyagban a kettő nincsen szétválasztva. Ami azért kényes dolog, mert az első individualizmus alacsony szintje, a másiknak a magas szintje a prediktív versenyképességi tényező. Vö.: www.gmconsulting.hu/szervezeti-kultura/versenykepessegi-orientaciok-vezetoi-szovegekbol/
süti beállítások módosítása