HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

Főbb témák

adatbányászat (6) adatok (12) adatújságírás (16) adatvizualizáció (17) AI (14) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (48) bing (14) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (15) Google (23) google (57) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (57) kereséselmélet (7) keresés jövője (55) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (6) LDA (10) lda (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (11) metafora (7) mobil (37) mobil keresés (17) Neticle (8) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (28) nyelvtechnológia (73) open data (11) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (46) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (18) szemantikus kereső (9) szentimentelemzés (34) szövegbányászat (15) társadalomtudomány (7) tartalomelemzés (54) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) twitter (15) Twitter (18) vertikális kereső (9) vizualizáció (12) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Idibon - Big Data Bábel

2013.05.21. 12:00 Szerző: zoltanvarju Címkék: nyelvészet nyelvtechnológia big data Idibon Nyelv és Tudomány

Az interneten keletkező információ legnagyobb része nyelvi, legyen az szöveg, audió vagy pedig videó. Napjainkban kb. ötezer nyelvet használnak a modern tömegkommunikációs eszközök használói és az általuk generált adatok elemzése során gyakran merülnek fel nyelvi, nyelvészeti kérdések. Az Idibon célja, hogy segítsen eligazodni az ilyen kérdésekben.  Az  NLP meetup volt előadója, Tyler Schnoebelen a friss startup senior data scientist munkatársa szerint a cég piacát azok az adatelemző központok jelentik, melyek felismerik, hogy a nyelvi adatok elemzéséhez szükségük van külső szakértőkre.

idibon_1.png

Az összes kommunikáció kb. hét százaléka az interneten zajlik ma. Ezt szemlélteti a Robert Munro (Idibon CEO) Strata előadásának ábrája.

idibon02.jpg

Habár több mint ötezer nyelvet használnak a netezők, a tíz leggyakrabban használt nyelv beszélőinek száma lefedi a felhasználók több mint felét. Látható, többet kommunikálunk mobilon (beszélgetés és SMS formájában is) mint interneten. Fontos ugyanakkor megemlíteni, hogy egyre gyakoribb az eltérő anyanyelvűek közötti kommunikáció (ami általában valamilyen közvetítőnyelven történik, ami legtöbbször az angol vagy valamelyik másik világnyelv). Akár egynyelvű, akár többnyelvű a vizsgálni kívánt dokumentumok köre, könnyen belátható, szükség van szakemberekre az adatok elemzése során. Számítógépes nyelvészt tartani drága mulatság és valószínűleg a legtöbb cégnek nincs is szüksége folyamatosan ilyen képzettségű munkatársakra. Az Idibon-on keresztül olyan szakemberek érhetők el, akiknek tapasztalata van az akadémia és az ipar világában is.

Az Idibon munkatársait a Stanford Department of Linguistics és a University of Pennsylvania-n működő Linguistic Data Consortium körében toborozta. A cég első magvető befektetője 1.4 millió dollárral az a Khosla Ventures, melynek olyan cégekben vannak érdekeltségei mint a bitly, a Kaggle és a Metamarkets. 

Az Idibon az első olyan nyelvtechnológiai és nyelvészeti tanácsadó cég, amely kockázati tőkét vont be és szinte egyedülálló a piacon. De csak szinte! Itthon a Nyelv és Tudomány kínál hasonló szolgáltatásokat.

Hogy mit nyújthat egy nyelvész a big data terén? Erre jó példa Tyler meetup előadása, melyben arról beszél, hogyan gazdagíthatjuk egy Twitter vizsgálat demográfiai adatait nyelvészeti elemzéssel.

Tyler Schnoebelen : Gender and style in American English tweets from Szamitogepes nyelveszet on Vimeo.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr235308696

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.