HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Our CTO talks at the first day of the next sprint.

2014.09.15. 08:42 Szerző: kereso Címkék: instagram

10643984_774646569259326_1403408958_n.jpg_612x612

precognox készítette ezt a képet.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Our New meetup already has 38 members #softdevkapos

2014.09.15. 07:01 Szerző: kereso Címkék: instagram softdevkapos

10693483_1473854142880136_1017272117_n.jpg_612x612

precognox készítette ezt a képet.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Rapháború III. - Hogyan írjunk rap slágert tudományos alapokon?

2014.09.10. 09:00 Szerző: zoltanvarju Címkék: tartalomelemzés szentimentelemzés emócióelemzés Precognox Labs rapháború

Régóta keressük a választ arra, hogy mitől lesz népszerű egy rap előadó. Félretettünk olyan kérdéseket mint a zene minősége, az előadó mögötti marketinggépezet működése és egyéb tényezők. A rap elvégre elvileg szövegcentrikus, kell hogy legyen valami köze a tartalomnak a népszerűséghez!  Lássuk mi a helyzet! Tanácsok dalszövegíróknak, tanulságok a szentiment- és emócióelemzés kapcsolatáról - mindez egy posztban!!!!

 

Mire ügyeljünk dalszövegünk megírása közben?

fb_lexical.png

Korábban már megállapítottuk, hogy a beszélt nyelvhez közeli lexikai diverzitással rendelkező szövegek előadó számíthatnak nagyobb népszerűségre. Bármennyire is egyediek akarunk lenni, a homofília nyelvi preferenciáinkban is érvényesül. Korábbi posztunkból az is kiderül, hogy a YouTube nézettség és a Facebook lájkoltság erősen összefügg, ezért mi most maradunk a lájkok számánál.

fb_sent.png

Úgy tűnik nem túl pozitív a legtöbb előadó, de itt is érvényesül a középre húzás; az extrém negativitás nem annyira népszerű. Nézzük mely emóciók megjelenítés korrelál a népszerűséggel!

fb_banat.png

Ha már mindenképpen negatív rap dal szeretnénk írni, akkor témánk a bánat legyen!

fb_duh.png

Ha dühösek vagyunk, semmiképen se öntsük dalba érzéseinket!!! Vizsgálódásaink azt mutatják, hogy viszonylag erős negatív korreláció (-0.55) mutatható ki a dühöt kifejező szavak aránya és a népszerűség között!!!!!

 fb_meglep.png

A meglepődés kifejezése, a dühvel ellentétben, pozitívan hathat népszerűségünkre.

Több tanáccsal sajnos nem szolgálhatunk azoknak, akik tudományos alapon közelítenék meg a hip-hop előadói pályát. Úgy tűnik, sajnos a zenére és egyéb zavaró tényezőkre is figyelni kell a szöveg mellett...

Lexikai diverzitás és érzelmeink

A lexikai diverzitással és a pozitív szavak aránya közötti korrelációt mérve 0.31-et kaptunk eredményül. Az emóciókat vizsgálva azt találtuk, hogy a düh és az öröm egyáltalán nem korrelál a lexikai diverzitással, ellenben a bánat, félelem és undor emóciókkal összevetve -0.44, -0.43 és -0.42 értékeket kaptunk.

banat_lexical.png

felelem_lexical.png

undor_lexical.png

A meglepődéssel is hasonló a helyzet, -0.33 értéket kapunk a korrelációra. Külön érdekes, hogy a pozitív szótárunk feleannyi szót tartalmaz mint negatív párja! A bánat, undor, félelem listák hosszában nincs különbség (kb. 200 elemet tartalmaz mindegyik átlagosan), a meglepődés kifejezetten rövid (úgy 50 elem), az öröm háromszor hosszabb mint egy átlagos emóciós szólista (kb. 600 elem). Csak spekulálni tudunk, de talán azért is csökken a lexikai diverzitás negatív érzelmi állapotban mert a beszélő nehezebben hívja elő a szavakat. A Pollyanna hipotézis kapcsán megemlítettük, hogy a magyar webkorpuszt vizsgálva is kimutatható a pozitív érzelmi töltetet hordozó szavak magasabb gyakorisága. Feltehetjük hogy a magasabb gyakoriság könnyebb előhívással is járhat, a negatív érzelmek pedig megnehezítik a lexikai elemek előhívását előadóinknál.

Az emóció az nem szentiment!

Megnéztük, találunk-e korrelációt a szentiment score-ok és az egyes emóciók között, de nem jutottunk sokra. Ezért külön vizsgáltuk a pozitív és negatív szavak és az egyes érzelmeket kifejező szavak arányai közötti összefüggéseket. Érdemleges eredményről csak a pozitív szentiment és az öröm (0.78), továbbá a negatív szentiment és a düh (0.65) között tudunk beszámolni. 

 

Aki sorozatunkon felbuzdulva megírja a következő rap slágert, azt ügyvédeink keresni fogják a jogdíjak ügyében. Mindenki mást figyelmeztetünk, csak saját felelősségére használja fel az olvasottakat! Reméljük továbbá, hogy sikerült meggyőzni legalább pár olvasót arról, hogy a szentiment- és az emócióelemzés két külön terület.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Játék az érzelmekkel!

2014.09.09. 08:36 Szerző: zoltanvarju Címkék: játék politikai blogok szentimentelemzés emócióelemzés

Játékot hirdetünk kedves olvasóink számára! A nyeremény egy, azaz egy kávé velem - nyilván nem ez fog megmozgatni titeket, de érdekes a kérdésünk! A politikai blogokat vizsgálva begyűjtöttük a magyar nyelvű oldalakat és mivel már rendelkezünk szótárakkal a szentiment- és emócióelemzéshez, elkezdtünk vizsgálódni ezen a téren.

posztok.png

Összesen 1644 url-t azonosítottunk nyelvazonosítással mint magyar nyelvű írás, amihez egyértelműen tudunk dátumot rendelni. A gyűjtésből kizártuk a Wikipedia, a Facebook és egyéb webkettes tartalmakat.

 

Szabó Martina és Morvay Gergely kollégák lelkes munkájának hála már vannak szótáraink szentiment- és emócióelemzésre is. Nem tudtuk megállni, hogy ne vessük be ezeket, ha már van egy korpuszunk.

 

szentiment.png

A fenti ábrán minden hónapra a vizsgált oldalak átlagos szentimentértékét láthatjuk. A szentimentelemzés azt mutatja, hogy ritkán kapunk negatív értéket! Ennek részben az az oka, hogy a blogok szeretnek híroldalakra linkelni s ezek semleges hangvétele kiegyenlíti a görbénket.

emociok.png

Játékunk az emóciókhoz kapcsolódik! A fenti ábra a hat alapvető érzelmet kifejező szavak átlagos gyakoriságát jeleníti meg. Nem véletlenül hiányzik a magyarázat a plotról! Kérdésünk az, hogy a kék görbe melyik érzelmet takarja!

 

Segítségül ajánljuk alábbi posztjainkat:

A megfejtéseket kommentben a blogon, vagy Facebookon várjuk, de ér tweetben is rám írni (@varjuzoli) egészen holnap reggel 9-ig.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

5 komment • Kövess Facebookon • Iratkozz fel értesítőre

Headed to the meet up after party, which was either some beer or lemonade. Kaposvar is a beautiful city indeed #softdevkapos

2014.09.09. 08:28 Szerző: kereso Címkék: instagram softdevkapos

10607954_1467783263503021_40600565_n.jpg_612x612

precognox készítette ezt a képet.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre