HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adatbányászat (9) adatelemzés (6) adatok (13) adatújságírás (16) adatvizualizáció (18) AI (14) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (51) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (15) Google (24) google (57) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (62) kereséselmélet (8) keresés jövője (55) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (7) LDA (10) lda (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (14) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (30) nyelvtechnológia (73) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (53) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (35) szövegbányászat (18) társadalomtudomány (7) tartalomelemzés (55) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) twitter (15) Twitter (18) vertikális kereső (9) vizualizáció (13) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Nomen est omen - avagy mit árul el rólunk a nevünk

2013.10.18. 08:00 Szerző: Zoltán Varjú Címkék: marketing nyelvészet társadalomtudomány nevek szegmentálás

Minden szülő fontosnak tartja, hogy gyermeke számára megtalálja a legmegfelelőbb nevet, de persze közben egyetértünk Júliával abban, hogy nem a név fontos egy ember megítélésében:

Mi is a név? Mit rózsának hívunk mi,

Bárhogy nevezzük, éppoly illatos.

Így, hogyha nem hívnának Romeónak,

E cím híján se volna csorba híred.

De tényleg így van ez? Hiszen nevünk az esetek többségében jelzi nemünket, a változó névadási szokások utalhatnak korunkra, de társadalmi és vagyoni helyzetünkre is - a vezetéknevekről ne is beszéljünk.

Mostanában szinte minden ismerősöm szülő lett és azt vettem észre, hogy a legtöbb baba az  Eszter, Anna, Jázmin, Hanna és Bence, Máté, Levente neveket kapta, melyek az utóbbi évek legnépszerűbb keresztnevei. Elkezdtem hát figyelni, milyen gyerekneveket hallok a környezetemben és a Dzsenifer, Dzsesszika, Vivien nyert a lányoknál, a Kevin, Krisztofer és Martin a fiúknál. Ismerőseim és barátaim a középosztály tagjai, általában magasan képzettek és nagyvárosokban laknak. Én viszont egy olyan kistérségben lakok, ahol a munkanélküliség és a roma lakosság aránya egyaránt kb. 20%. Talán önmagában az, hogy valakit Kevinnek hívnak nem árulkodik arról, milyen szociokulturális közegből érkezik, de mi a helyzet Szabó Kevinnel és Lakatos Kevinnel? Lehet, nevünk nem csak nemünket, de korunkat és társadalmi hátterünket is elárulja?

A nevek gazdaságtana

Hazánkban különböző okok miatt nem gyűjtenek nemzetiségre vonatkozó adatokat az újszülöttekről és szüleik hátteréről. Azonban Roland G. Fryer Jr. és Steven D. Levitt a kaliforniai születési statisztikákat használva érdekes eredményeket tártak fel a nevekkel kapcsolatban. A két kutató a szülők lakhelyét használva következtetett etnikai hovatartozásukra és a kórházi számla kiegyenlítésének módjából pedig anyagi helyzetükre. További hasznos fogódzót jelentett nekik, hogy Kaliforniában rögzítik az anya családi állapotát, korát és iskolai végzettségét is. Ezen adatok birtokában már empirikusan is bizonyítható volt az, amit sokan sejtettek; a feketék névadási szokásai jelentősen eltérnek a többségi társadalométól, ahogy az alábbi táblázat is mutatja (forrás Freakonomics):




A “legfehérebb” lánynevek

A “legfeketébb” lánynevek

A “legfehérebb” fiúnevek

A “legfeketébb” fiúnevek

1.

Molly

Imani

Jake

DeShawn

2.

Amy

Ebony

Connor

DeAndre

3.

Claire

Shanice

Tanner

Marquis

4.

Emily

Aaliyah

Wyatt

Darnell

5.

Katie

Precious

Cody

Terrell

6.

Madeline

Nia

Dustin

Malik

7.

Katelyn

Deja

Luke

Trevon

8.

Emma

Diamond

Jack

Tyrone

9.

Abigail

Asia

Scott

Willie

10.

Carly

Aliyah

Logan

Dominique

11.

Jenna

Jada

Cole

Demetrius

12.

Heather

Tierra

Lucas

Reginald

13.

Katherine

Tiara

Bradley

Jamal

14.

Caitlin

Kiara

Jacob

Maurice

15.

Kaitlin

Jazmine

Garrett

Jalen

16.

Holly

Jasmin

Dylan

Darius

17.

Allison

Jazmin

Maxwell

Xavier

18.

Kaitlyn

Jasmine

Hunter

Terrance

19.

Hannah

Alexus

Brett

Andre

20.

Kathryn

Raven

Colin

Darryl

Szintén különös fejlemény, hogy a fekete közösségen belül egyre kevesebb gyerek kapja ugyanazt a nevet, ahogy az alábbi ábra is mutatja.

photo.jpg

Ezáltal önmagában az a tény, hogy valakinek különleges neve van egyre jobban jelzi, hogy nem a többségi társadalom tagja. Hogy ez jó vagy rossz? Attól függ milyen a társadalmi környezet, önmagában a név nem okozója a különbségeknek, sokkal inkább oka.

Ugyanakkor érdemes odafigyelni Sendhill Mullainathan és tsai vizsgálataira is, mely bebizonyította, a név igen komoly akadály lehet a munkaerőpiacon. Mullainathan nagyon egyszerű és ötletes kísérlettel állt elő: két ugyan olyan képzettséggel és előélettel rendelkező fiktív személy önéletrajzát írták meg és küldték el álláshirdetésekre, a két pályázó közötti egyedüli eltérés a nevük volt; egyikük szép hagyományos fehér nevet kapott, míg a másik igazi afro-amerikait. Az eredmények szerint harmad annyi esélye van a fekete névvel rendelkező személyeknek arra, hogy felhívják őket, mint a fehéreknek...

Név = nem, kor, jövedelem

De kanyarodjunk vissza a szegmentáció kérdéséhez! Ha van megfelelő adatunk, úgy tűnik pusztán keresztnév alapján is sokat megtudhatunk egy emberről. Tyler Schnoebelen egyik tavalyi meetupunkon elmondta, hogy vizsgálódásaik során a férfi- ill. nő nevek listáival határozták meg vizsgálati alanyok nevét és a névadási statisztikákat használva nagy hatékonysággal tippelték meg korukat is!

Tyler Schnoebelen : Gender and style in American English tweets from Szamitogepes nyelveszet on Vimeo.

Fryer és Levitt nagyon sok változót megvizsgált, ezek közül szemezgetve az egyik legkirívóbb, az anya iskolázottsága és a gyermek neve közötti kapcsolat. A fehér lánynevek közül az alábbiak jelzik a leginkább az anyuka iskolázottságát években megadva.

A húsz leggyakoribb alacsony iskolázottságot jelző fehér lánynév (forrás Freakonomics)

(Zárójelben az anya iskolázottsága években kifejezve)

1. Angel (11.38)

2. Heaven   (11.46)

3. Misty   (11.61)

4. Destiny   (11.66)

5. Brenda   (11.71)

6. Tabatha   (11.81)

7. Bobbie   (11.87)

8. Brandy   (11.89)

9. Destinee   (11.91)

10. Cindy   (11.92)

11. Jazmine   (11.94)

12. Shyanne   (11.96)

13. Britany   (12.05)

14. Mercedes   (12.06)

15. Tiffanie   (12.08)

16. Ashly   (12.11)

17. Tonya   (12.13)

18. Crystal   (12.15)

19. Brandie   (12.16)

20. Brandi   (12.17)

 

A szülők, különösen az anya, iskolázottsága az egyik legmeghatározóbb faktora a gyermek jövőbeli iskolázottságának és jövedelmének. Az eddig bemutatott adatok a kilencvenes évekre vonatkoznak, de Steven D. Levitt és Stephen J. Dubner Freakonomics című könyvükben kitértek a névadási divatokra is. Ha megnézzük a kétezres években az alacsony és a közepes jövedelmű családok névadási szokásait, akkor jelentős átfedéseket látunk a két csoport között - vessünk egy pillantást a lánynevekre (forrás Freakonomics)



kis jövedelmű családok népszerű lánynevei

közepes jövedelmű családok népszerű lánynevei

1.

Ashley

Sarah

2.

Jessica

Emily

3.

Amanda

Jessica

4.

Samantha

Lauren

5.

Brittany

Ashley

6.

Sarah

Amanda

7.

Kayla

Megan

8.

Amber

Samantha

9.

Megan

Hannah

10.

Taylor

Rachel

11.

Emily

Nicole

12.

Nicole

Taylor

13.

Elizabeth

Elizabeth

14.

Heather

Katherine

15.

Alyssa

Madison

16.

Stephanie

Jennifer

17.

Jennifer

Alexandra

18.

Hannah

Brittany

19.

Courtney

Danielle

20.

Rebecca

Rebecca

 

Az adatokat megvizsgálva arra jutott a szerzőpáros, hogy a kis jövedelmű családok névadási szokásai pár év késéssel követik a felsőbb osztályokét, ez okozza a jelentős átfedést.

Freakonomics.jpg

Vezetéknevek

Sajnos hasonló magyar vonatkozású adatokról nincs tudomásunk - ha valakinek van, kérjük írjon nekünk! A vezetéknevekkel most nem foglalkoztunk, de nem állunk talán messze az igazságtól, ha feltesszük, bizonyos esetekben jól jelzik az etnikai hovatartozást (az afro-amerikaiak körében az adatok szerint ez így van).

A gyakorlatban

A nevek önmagukban nem érdekesek, ez ellen csak a névtannal foglalkozó szakembereknek lehet kifogása.  Viszont, ha sok adat mellett rendelkezünk a vizsgált alanyok nevével is, akkor jelentősen megkönnyíthetik a felhasználók szegmentálását nem, kor és akár iskolázottság/jövedelem szerint is. Pl. a Neticle újdonsága a nemek szerinti szegmentálás, így már nem csak a a populáció egészére adnak véleményárfolyamot, hanem férfi-női bontásban is. További felhasználási terület lehet, a más módszerekkel nyert eredmények validálása is - de persze csak akkor, ha van megfelelő minőségű és mennyiségű adat!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr75580352

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.