HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Amikor egy adathibán nemzetek sorsa múlhat...

2013.05.13. 08:00 Szerző: Zoltán Varjú Címkék: analitika adatok

Az ún. evidence-based policy, azaz az evidencia alapú politikacsinálás egyre nagyobb teret hódít. A big data-nak köszönhetően már nem csak közszférában, hanem a vállalatirányításban is megjelent ez az irányzat. Míg a vállalatok esetében érthető, hogy nem teszik közkinccsé adataikat, a súlyos politikai döntéseket megalapozó kutatásokkal szemben ez alapvető elvárás kellene hogy legyen. Reinhart és Rogoff Growth in a Time of Debt tanulmányát az Egyesült Államokban és az EU-ban is előszerettel lobogtatták a szigorú megszorítások hívei, de Herndon, Ash és Pollin kimutatta, hogy komoly gondok vannak a vizsgálódás során használt táblázattal.

Az inkriminált tanulmány szerint az országoknak ügyelniük kell arra, hogy a GDP-hez viszonyított államadósságuk szintje ne haladja meg a kritikus 90%-ot. Ez az az határérték, melyet átlépve a gazdasági növekedés drámaian lecsökken. A The Economist összefoglalója szerint azonban:

 A coding error in their Excel spreadsheet sliced several countries out of the data set. Several critical years of post-war data from New Zealand were left out, thereby omitting a time in which both its debt level and growth rate were high. And the authors reckon the Reinhart-Rogoff method of calculating average growth gave outsize weight to unrepresentative data points (including one year of abysmal New Zealand data). Taken together, the authors of the new paper reckon that average post-war growth above the 90% threshold ought to have been reported at 2.2% rather than -0.1%

Ennek tükrében jelentősen módosulnak az adatok. A The Economist ábrája remekül szemlélteti a "régi" és az "új" eredményeket.

 

anti_reinhart.png

 

Az eset alaposan felkavarta a kutatókat szerte a világban. Az Open Knowledge Foundation felhívta a figyelmet a nyílt adatok szükségességére a tudományban (és a tudományos eredményekre alapozott politikacsinálásban). De vannak akik szerint a nyílt tudomány felé tett lépések ellenére az ilyen hibák lehetősége "benne van a rendszerben" és a tudomány művelése során elkerülhetetlenek.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Nyári szakmai gyakorlati lehetőség a Precognox-nál

2013.05.10. 08:00 Szerző: Zoltán Varjú Címkék: gyakorlat Precognox

Kaposváron működő, innovatív informatikai fejlesztő cégünk szívesen biztosít gyakorlati helyet érdeklődő, környékbeli, elsősorban Óbudai Egyetem vagy BME mérnök informatikus, illetve ELTE programtervező informatikus hallgatók számára. A legjobban teljesítőknek hosszú távú munkalehetőséget biztosítunk.

precognox_team.jpg

Ha érdekel a lehetőség, már sikeresen túl leszel legalább négy féléven, és legalább 4 hétre tudsz jönni, bátran jelentkezz online.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Szezonzáró NLP Meetup

2013.05.09. 08:00 Szerző: Zoltán Varjú Címkék: blogok meetup nyelvtechnológia Neticle social media monitoring NLP meetup Replise kognitív nyelvészet Méltányosság


Május 22-én tartjuk szezonzáró meetupunkat 18 órától a Colabs-ben (Budapest, Irányi út 3). A részvétel ingyenes, de előzetes regisztrációhoz kötött

meetuplogo.jpegNeticle Technologies - Méltányosság Politikaelemző Központ: Politikai véleményárfolyam

A Méltányosság Politikaelemző Központ és a Neticle Technologies egy itthon egyedülálló kutatást indított útjára, amely innovatív módszerekkel eddig ismeretlen szemszögből láttatja a hazai politikai folyamatokat. A Neticle Technologies saját fejlesztésű webes szöveganalízisére építve az MPK a fő politikai manőverek, taktikai lépések és a véleményalkotás összefüggéseire fókuszáló elemzéseket készít. Az elemzés nem csupán az internetes szféra véleményreflexióira világít rá, hanem feltárja a háttérben meghúzódó ok-okozati kapcsolatokat is. A májusi NLP meetupon az április havi történéseket vesszük górcső alá. (Az előadás elején kitérünk a módszertani kérdésekre is.) 
Korábbi elemzések: 
2013. február: http://meltanyossag.hu/node/3233 
2013. március: http://meltanyossag.hu/node/3268 

Méltányosság Politikaelemző Központ 
A Méltányosság Politikaelemző Központ Magyarország első specifikus, a társadalmi és a politikai kohézió kutatására szakosodott agytrösztje, amely megőrzi és új tematikájában is alkalmazza a cég méltányos és elfogulatlan szemléletmódját.Agytrösztünk a politikában megszüntethetetlennek látja a konfliktust, nélkülözhetetlennek a konszenzust és pótolhatatlannak a kohéziót. E három fogalom mind alaposabb tudományos jellegű feltárására, egymáshoz való viszonyuk bemutatására, és az akadémiai jellegű kutatómunka mellett egy Magyarországon merőben újszerű kohéziós stratégia kimunkálása érdekében tevékenykedünk. 

Netice Technologies 
A Neticle-t egy fiatal szakértői csapat hozta létre azzal a céllal, hogy a jelenleg elérhető közösségi média és online sajtófigyelési szolgáltatásokon túlmutató támogatást kínáljon. Ennek eredménye egy olyan rendszer, ami közel valós időben, a webes véleményárfolyam kiszámításával tudja követni, hogy mi a véleménye a magyar webnek egy cégről, termékről, szolgáltatásról, vagy akár a versenytársakról. 

 

Petykó Márton: Mit mond kognitív nyelvészet a blogokról?

Előadásomban bemutatom, hogy hogyan értelmezhető a diskurzustípus és a műfaj fogalma a kognitív pragmatika elméleti keretében. Ezt követően az előbbi fogalomértelmezéseket a gyakorlatban is alkalmazom a számítógép közvetítette kommunikáció egyik jellegzetes műfajának, a blognak a vizsgálata során. Áttekintem, hogy a blogok esetében melyek azok a műfaji jellemzők, amelyek minden példányra érvényesek, és melyek azok, amelyek a példányoknak csak egy bizonyos részére. Végül szót ejtek a spontán írott nyelv és a tervezett írott nyelv fogalmáról, valamint alkalmazhatóságáról a blog két megnyilatkozástípusának: a posztnak és a kommentnek a jellemzése során.

 

Petykó Márton az ELTE BTK Magyar nyelv és irodalom szakának végzős hallgatója beszédtudomány szakirányon. Emellett az MTA Nyelvtudományi Intézet Szótári Osztályának tudományos ügyintézője. Fő érdeklődési területe a számítógép közvetítette kommunikáció, valamint a nyelvhasználat és az identitásképzés viszonyának kognitív pragmatikai vizsgálata.

 

Tempfli Péter: Social media monitoring - Néhány gyakorlati kérdés

Az prezentáció bemutat néhány, a közösségi média figyelés napi gyakorlatában felmerülő problémát. Szólok az adatok megkereséséről és begyüjtéséről, a releváns kérdések megfogalmazásáról és az eredmények bemutatásáról. Szó fog esni arról, mit lehet és mit nem lehet mérni, illetve arról is, mikor érdemes mérni, mikor pedig más technikát választani. Végül, röviden bemutatom a Replise rendszert. 

Tempfli Péter az ELTE BTK orosz szakán végzett, jelenleg a Budapest Corvinus Egyetem gazdasági informatika szakos hallgatója. Szociális méda elemző a Replise-nél, magyar, lengyel és orosz piacokkal foglalkozik.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

House of Cards – tartalom és big data

2013.05.07. 12:00 Szerző: Zoltán Varjú Címkék: analitika big data Netflix tartalomgyártás

A tartalomgyártásban már régóta jelen van a fogyasztói viselkedés és igény mérése. A szórakoztató lapok vetették be először a kérdőívezést, de ma már a komoly lapok is rendre végeznek felméréseket, hogy megismerjék olvasóikat. Míg az eladási statisztikák utólag árulnak el sokat a tartalomról, addig ezek a felmérések segítenek abban, hogy a fogyasztók számára kívánatosabb legyen a termék. A Netflix House of Cards sorozata azonban új szintre helyezte az ilyen felméréseket.

huffpost.jpg

A The Hufftington Post az első olyan híroldal, ami intenzíven használja az A/B tesztelést arra, hogy megállapítsa mely címek és leader szövegek keltik fel jobban az olvasók érdeklődését. Az eljárás az utóbbi időben annyira elfogadottá vált, hogy olyan népszerű blog motorokhoz mint pl. a Wordpress is megjelentek az ezt lehetővé tevő bővítmények.

A New York Times nemrég jelentette be, hogy szerkesztőségi analitikai csoportot állít fel. A csoport célja, hogy a szerkesztőségnek segítsen jobban megérteni kik és hogyan fogyasztják a lapot, tehát, hogy hatással legyenek a tartalomra.

new-york-times-building.jpg

A Netflix tkp. egy online videótéka, csak éppen nem kikölcsönözik, hanem ún. streaming formájában, folyamatos internet kapcsolat mellett tekinthetik meg ügyfelei a filmeket. A cég így rengeteg adatot gyűjthet a felhasználókról; a megtekintés ideje, a megszakítások gyakorisága, hol hagynak abba egy filmet, hogyan néznek sorozatot az egyes korosztályok, mely témák érdekesek stb. Ennek szolgálatában a Netflix egy nagyon komoly analitikai architektúrát épített ki (a technológia iránt érdeklődők erről bővebben is olvashatnak itt).

A Netflix ezen adatokra alapozva vágott saját tartalom gyártásába. A lépés logikusnak tűnik, hiszen a cég alaposan ismeri saját piacát és költséghatékony megoldás kikerülni a televíziós és mozis piacot megcélzó gyártókat. Az irányt az Amazon is igyekszik követni. A nézők ezzel biztosan nyernek, hiszen a szolgáltatók szeretnék az ízlésüket minél jobban kiszolgálni. Kérdés mennyi tere marad így a kísérletező, újító alkotásoknak. (A Kontent blogon bővebben is olvashatsz a Netflix új sorozatáról és a big data alkalmazásáról.)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Gráfra fel - BarCamp előadás

2013.05.03. 12:00 Szerző: Kereso75 Címkék: előadás Web 2.0 Symposium BarCamp gráfok

Tegnap a Web 2.0 Symposium - BarCamp konferencián adtam elő Gráfra fel! címmel, arról hogyan változtatják meg a közösségi média legújabb fejlesztései a (mobil) keresést.

A beágyazott videók sajnos nem érhetők el a slideshare-en, ezért érdemes a prezentációt letölteni ezen a linken. Az előadásban említett témákról az alábbi anyagokban többet is megtudhatsz:

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása