HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Plotly - kollaboratív interaktív adatvizualizáció

2014.09.03. 08:00 Szerző: Zoltán Varjú Címkék: adatelemzés Plotly

A Plotly az egyik legérdekesebb próbálkozás a közös adatelemzés és annak eredményeinek bemutatására létrehozott alkalmazások között. Gyakran végeláthatatlan email áradatot eredményez a közös munka, sok-sok csatolmánnyal, tovább bonyolítja a helyzetet, hogy mindenkinek megvan a maga kedvenc nyelve a munkára.

plottly00.png

A Plotly a legtöbb bevett nyelvhez (Python, R, Julia, Matlab) nyújt könyvtárat, mely segítségével pár sort kell beszúrnunk kódunkba ahhoz, hogy megoszthassuk elemzésünket.  Az eredmény egy nagyon szép online felület, ami a vizualizációt, az adatokat és a kódot is tartalmazza.

ploty01.PNG

A grafikonok ggplot-szerűen jelennek meg, de a háttérben a D3.js dolgozik.

ploty02.PNG

Az adatokat táblázatos formában jeleníti meg a Plotly.

ploty03.PNG

A grafikont generáló kódot több nyelven is elérhetjük, a felület alsó részén arról is tudósít minket a Plotly, hogy eredetileg mivel készítették a plotot.

ploty04.PNG

A legtöbb kód (még a generált kódok is) úgy jelenik meg, mint egy szerkesztőben.

 

Aki szeretne jobban megismerkedni a Plotly-val, annak a Bad Hessian posztját ajánljuk a témában. Az egyszerű használhatóság, a legtöbb nyelv támogatása és az ingyenesség miatt mindenkinek ajánlani tudjuk ezt a remek eszközt! Reméljük funkcionalitásában hamarosan felveszi a versenyt az R-használók körében egyre népszerűbb Shiny-val is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Egyenlőtlenség és keresési trendek

2014.09.01. 09:41 Szerző: Zoltán Varjú Címkék: egyenlőtlenség Google GoogleCorrelate

Ahogy korábban is írtuk már, a nowcasting szépsége az, hogy a hagyományos adatfelvétel gyors és olcsó alternatívája lehet - persze csak akkor ha tudjuk, mivel helyettesíthetjük szokásos adatainkat. A The Upshot az Egyesült Államokban vizsgálata az életminőségben tapasztalható területi egyenlőtlenségeket, majd a GoogleCorrelate segítségével megtalálták mely keresési kifejezések jelzik jól előre a hagyományos indikátorokat.

inequality01.png

A What Are the Hardest Places to Live in the U.S.? minden megyére kiszámított egy hat mutatóból (oktatás, jövedelem, munkanélküliség, fogyatékossági ráta, várható élettartam, elhízottság) álló indexet.  

inequality02.png

A GoogleCorrelate segítségével megvizsgálták, mely keresési kifejezések korrelálnak az indexben szereplő adatokkal, erről a In One America, Guns and Diet. In the Other, Cameras and ‘Zoolander.’ posztban számoltak be. Fontos megjegyezni, hogy a keresések nem abszolút trendet jelentenek, hanem az adott területen megfigyelhető kapcsolatot az indexet alkotó változók és a keresési kifejezések között. Érdekes, hogy a jóléti térségben a digitális kamerák, utazási desztinációk, a bébimasszázs és társaik, a leszakadó régiókban a betegségekkel, fegyverekkel és szociális ellátással kapcsolatos kifejezések jó prediktorok. Érdekes lenne megvizsgálni, hogy egy adott régióban tapasztalható társadalmi változások előrejelezhetőek-e a Google keresési trendjeire alapozva...

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Szeptember 3-án R and C++ a BURN meeutpon

2014.08.28. 08:00 Szerző: Zoltán Varjú Címkék: meetup R

A BURN meetup ismét remek témával örvendezteti meg az R iránt érdeklődő közönséget! Szeptember 3-án Romain Francois az R és a C++ egyre népszerűbb kombinálásáról tart előadást, a rendezvény ingyenes, de a szervezők arra kérnek mindenkit, hogy az esemény oldalán regisztráljon

ppt.png

A leírás alapján igazi hardcore fejlesztői élményben lehet része a résztvevőknek:

Romain Francois is a well-know R developer, R Enthusiast and R/C++ hero beside being an occasional stand up comedian. This suggests that we will have a wonderful time at the next R User Group. Romain will talk about his Rcpp11 package:

R and C++ is an increasingly popular mix. I will talk about past, present and future of this combination. 

Integrating R and C++ has been facilitated by R packages around Rcpp for several years now, we will review some of the key features of Rcpp and discuss some successful packages that have been using Rcpp. 

The last part of the talk will be dedicated to the future of R and C++. For that purpose I will introduce Rcpp11, a new implementation that focuses on the last C++ standard. Beyond C++11, we will discuss directions for future work in R and C++. 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Kvantumfizika és nyelvészet

2014.08.25. 13:06 Szerző: Zoltán Varjú Címkék: nyelvészet könyvajánló szemantika nyelvtechnológia kvantumszámítás

A nyelvtechnológia jelentős része az ún. normál tudomány körébe tartozik, azaz bevett eszközökkel próbálunk megoldani rejtvényeket, minden úgy működik ahogy az "a nagykönyvben meg van írva". A kilencvenes évekig ez a szabályalapú, logikai módszerek alkalmazását jelentette, Charniak könyvének megjelenése óta pedig a statisztikai és gépi tanulási módszerek egyeduralomra jutottak. Napjainkban jelent meg egy új irányzat az Oxford University kutatócsoportjának hála amely megpróbálja közös nevezőre hozni a két irányzatot a szemantikában, azaz a kompozícionális és a disztribúciós elméleteket és ehhez a kvantumfizikát hívták segítségül!

qpl.jpg

A Quantum Physics and Linguistics egy tanulmánykötet, szerzői a Quantum Group-hoz kötődnek így vagy úgy. A témák egészen vegyesek, a kvantumszámítástól a kompozícionális-disztributív szemantikáig sok dologgal találkozhatunk benne s gyanítom hogy kevés ember akad a földön aki képes megérteni minden érintett téma hátterét. Az biztos, hogy akinek nem dereng egy kicsit a kategóriaelmélet, a kvantumlogika és a disztribúciós szemantika (vagy a vektorterek), az inkább bele se kezdjen az olvasgatásába (nekik ajánljuk Widdows Geometry and Meaning könyvét)!

 

Nagyon dióhéjban a kvantumfizika azért keveredik a szemantikához, mert abban is fellelhető hogy a makroszinten más törvények (kompozícionalitás) uralkodnak mint a mikroszinten (disztribúció). Nagyon úgy tűnik, a fizikusok számára eme kettősség kezelésére a kategóriaelmélet kézenfekvő volt, szerencsére ez a matematikai nyelvészettől és a logikától sem idegen dolog. A kötetből én az alábbi tanulmányokat ajánlom kezdésnek ennek szellemében:

  • Michael Müger: Modular Categories
  • Dion Coumans and Bart Jacobs: Scalars, Monads, and Categories
  • Peter Hines: Types and forgetfulness in categorical linguistics and quantum mechanics
  • Stephen Pulman: Distributional Semantic Models
  • Stephen Clark: Type-Driven Syntax and Semantics for Composing Meaning Vectors

Mielőtt bárki azt hinné, ez csak üres elméleti bűvészkedés ne felejtsük el, hogy a Google nem is olyan régen vette magának kvantumszámítógépeket a D-Wave cégtől és a kereső óriás rengeteg energiát fektetett már a disztribúciós szemantikába (csak ők információkinyerésnek hívják, mint rendes számítástudósok), aminek lassan elérkezünk a korlátaihoz s ezért saját Quantum AI Group-ot alapított. Aki pedig a pénzhajhászokat hurrogná le, hogy "no de hol marad az elme modellezése?", azoknak érdemes Loewenstein Physics in Mind: A Quantum View of the Brain című könyvét elolvasniuk.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Nyelvészet mindenkinek 3.

2014.08.22. 08:00 Szerző: Zoltán Varjú Címkék: nyelvészet könyvajánló

Az egyik legnépszerűbb olvasói kérdésünk, hogy mit olvasson az ember ha érdekli a nyelvtechnológia, de magával a nyelvvel még nem nagyon foglalkozott. Korábban már ajánlottunk kifejezetten ilyen embereknek írott könyvet és a legjobb magyar nyelvészeti tudományos ismeretterjesztő könyvet is bemutattuk blogunkon. Még az előbbit sokan "túl keménynek", az utóbbit "túl lazának" tartják, ezért most az örök klasszikust, A nyelv és a nyelvek című tankönyvet ajánljuk mindenkinek.

borito2.jpg

A kötet először 1984-ben jelent meg, legutóbbi, hatodik kiadása pedig 2011-ben. Az elmúlt harminc évben a könyv folyamatosan bővült és természetesen a kor követelményeinek megfelelően frissítették a tartalmát. A mű kb. egy rendes, akadémikus, de mégis könnyed bevezetés a nyelvtudományba. Túllép az ismeretterjesztésen, de nem merül el a részletkérdésekben, "csak" egy rendes, átfogó képet próbál adni a nyelv tudományos vizsgálatáról. Ebben a könyvben tényleg mindenről olvashat az ember, ami a nyelvvel kapcsolatos; a klasszikus szemantika, nyelvtan, morfológia, hangtan témákon túl egy-egy fejezet foglalkozik a nyelvelsajátítással, a nyelv idegrendszeri alapjaival, az írással, a számítógépes nyelvészettel, a pszicholingvisztikával és még a nyelvfilozófia sem maradt ki. Az egyes fejezetek nyelvezete kifejezetten jól érthető kb. egy érdeklődő középiskolásnak is felfogható módon próbálnak fogalmazni a szerzők. Szerencsére példákat is találunk, nem csak unalmas leírásokat olvashatunk arról mi hogyan működik elvileg a nyelvben. Minden fejezet végén találunk feladatokat, a kötet honlapja további feladatokat tartalmaz (meg az összes feladat megoldását). Egyetlen problémám van csupán a könyvvel, néhol annyira kerülni próbálják a szakzsargont a szerzők, hogy nagyon megnehezítik annak a dolgát, aki tovább keresgélne egy-egy témában.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása