HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Mire jó a szentimentelemzés?

2013.06.17. 08:00 Szerző: Zoltán Varjú Címkék: Bloomberg Luminoso szentimentelemzés Sentiment Symposium SmogFarm BrandVectors

Ha már nem lehettünk ott a Sentiment Analysis Symposium-on, kerítettünk egy kis időt a konferencia Vimeo csatornájának bámulására. Elégedetten konstatáltuk, hogy immáron vége a hurrá optimizmusnak és lassan, de biztosan megtalálja helyét a szentimentelemzés a piacon. A posztban négy előadást emelünk ki, mivel úgy gondoljuk nagyon fontos dolgokra mutatnak rá.

Customer Affinity Meets Brand Vectors: Sentiment That Matters (Augie Ray) from Seth Grimes on Vimeo.

Ezt az előadást nyugodtan megnézheti az is, aki nem tudja mit is jelent a szentimentelemzés. Marketingeseknek kifejezetten ajánljuk, hiszen gyakorlati példákon keresztül (pl. United Breaks Guitars, #NBCFail) világít rá arra, hogy egy negatív szentiment hullám nem árt feltétlenül egy márkának. Ugyanakkor a pozitív szentiment kialakítása során fontos szem előtt tartani, hogy az a márkánkra, vagy a közösségi oldalakon posztolt tartalmakra vonatkozik. Az egészben a legszebb, hogy viccesnek tűnő előadás során teszi rendbe a szentimentelemzéssel kapcsolatos tudnivalókat Augie Ray.

Big Data, Linguistics, and the Science of Crowd Psychology (Erin Olivo, SmogFarm) from Seth Grimes on Vimeo.

Korábbi posztjainkban már bemutattunk kísérleteket (l. A tweet a lélek tükre(?) és Gazdasági előrejelzés szentimentelemzéssel című írásainkat) arra, hogy a "hagyományos" szentimentelemzést felváltsák ún. emócióelemzéssel. A SmogFarm is ebbe a vonalba illeszkedik és avval büszkélkedhet, hogy ő a terület első startupja. A szentiment kategóriák helyett, amik általában három (pozitív, semleges, negatív) vagy öt (nagyon pozitív, pozitív, semleges, negatív, nagyon negatív) kategóriába sorolnak be egy szöveget, a SmogFarm egy sokkal szofisztikáltabb megoldást használ. James W. Pennebaker lassan negyven éve kutatja, hogyan fejeződnek ki érzelmeink az általunk kreált beszédben és szövegekben és most mint tanácsadó segíti a startupot.  A kialakított eljárás remekül előrejelzi pl. a Gallup Daily Mood Poll-t. Az online tartalmak monitorozása viszont sokkal olcsóbb, mint a telefonos vagy személyes kérdőívezés, továbbá lehetővé teszi, hogy ne csak napi, hanem akár óránkénti bontásban is elkészítsék az indexet. A SmogFarm itt nem állna meg, céljuk a pénzügyi előrejelzés. A következő videóból azonban kiderül, hogy ez nem olyan könnyű.

News Analytics in Finance (Gary Kazantsev, Bloomberg) from Seth Grimes on Vimeo.

Érdekes, hogy miközben sokan gondolják úgy, a szentimentelemzés jó prediktor lehet gazdasági előrejelzésre, a Bloomberg-nél arra jutottak, hogy nem ez a helyzet. Gary Kazantsev szerint az ún. szózsák modellek alkalmatlanok arra, hogy kezelni tudják a nyelv komplexitását (pl. metafora, szarkazmus) és egy adott dokumentumot értelmetlen egy szentimentértékkel leírni (legalábbis pénzügyi hírek esetében). Ezért átálltak inkább a hatásvizsgálatra, ami egy hír hatását (impact) és újdonságát (novelty) próbálja meg azonosítani. Arra jutottak, hogy egy hír általában három napig él a médiában, ami nagyon sok zajt generál. Tovább bonyolítja a helyzetet, hogy  globális gazdaságban több nyelven terjednek az információk. Első lépésben egy olyan tréningkorpuszt készítettek, mely a múltbeli gazdasági változásokhoz rendelt híreket, melyeket aztán annotátorok láttak el metaadatokkal. Így a Bloomberg nem szentimentet keres a médiamonitirozás közben, hanem olyan jeleket, melyek relevánsak a gazdasági döntéshozók számára. A többnyelvűség problémáját gépi fordítással oldották meg, ami saját bevallásuk szerint sem tökéletes még, de helyzeti előnyt jelent, mivel gyors reagálást tesz lehetővé. Egyszerűen lenyűgöző, hogy házon belül milyen szofisztikált rendszert fejlesztettek ki ezek a szakik!

Multi and Cross-lingual, Concept-based Sentiment Analysis (Catherine Havasi, Luminso) from Seth Grimes on Vimeo.

A Luminoso-t korábban már bemutattuk blogunkon. Érdemes kiemelni, hogy a cég a többnyelvűségre és a szentiment kontextusára helyezi a hangsúlyt. A ConcepNet-re alapozott lexikai gráfjuk lehetővé teszi, hogy ne csupán szentimentet azonosítsanak, hanem az adott szentimenttel kapcsolatos fogalmi hálót is. Ez pedig visszavezet minket Augie Ray előadásához.

A Sentiment Analysis Symposium előadásainak megtekintése során úgy éreztük, hogy a terület immár felnőtt korba lépett. Nem úgy tekintenek a szentimentelemzésre, mint mindent gyógyító csodaszerre, hanem mint egy hasznos eszközre. További érdekesség volt az emócióelemzés egyre hangsúlyosabb megjelenése, amit viszont még körül leng a misztikum. A legpragmatikusabb és józanabb Gary Kazantsev és Augie Ray volt szerintünk, ők egyszerre mutatták be a technológiában rejlő lehetőségeket és éreztették annak határait.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr765357419

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása