HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Robotok: bevándorlók a jövőből

2014.04.03. 08:00 Szerző: Zoltán Varjú Címkék: ajánló robotok mesterséges intelligencia

Vezető nélküli autók, autonóm porszívók, drónok - az utóbbi évtizedben egyre több robot jelent meg életünkben, a The Economist melléklete szerint ők nem mások, mint bevándorlók a jövőből. Habár az iparban - különösen a gépgyártás és az autóipar területén - már régóta alkalmaznak robotokat, napjainkban érkeztünk el egy fordulóponthoz, amikor több technológiai tényező együttállásának köszönhetően kritikus tömegű robotikai kutatás és vállalkozás gyűlt össze. A nagy dobásra még várni kell, a mennyiség még nem csapott át minőségbe, de a köztünk "élő" robotok betekintést nyújtanak a jövőbe!

 2014-04-01 08.10.51.png

A The Economist csatornáján a riport szerkesztője röviden összefoglalta a robotika jelenlegi helyzetét. Akik a cikkeket szeretnék bogarászni, azok figyelmét felhívjuk arra, hogy a lap ún. metered paywall modellben csak napi pár írást tesz elérhetővé ingyen - ezért előfizetéssel nem rendelkező olvasóinknak be kell osztaniuk a cikkeket.

 

A riport érdekessége, hogy az ipari robotok fő használói Dél-Korea és Japán után európai államok! Nem véletlen, hogy külön a robotikával foglalkozó kockázati tőketársaságok alakulnak sorra az öreg kontinensen!

2014-04-01 08.13.33.png

Hogy mit hoz a jövő, azt nem tudhatjuk. Azonban elgondolkodtató, hogy a robotok által betöltött állások helyett valószínűleg kevesebb új munkahely jön majd létre. Ha szerencsénk van, akkor Marx jóslata szerint minden ember felszabadul a munka terhe alól s művésszé válhat, ha nem akkor McAfee és Brynjolfsson (sajnos empirikusan is alátámasztott) jóslata szerint egyre tovább nyílik a gazdag és technológiai újításokhoz hozzáférő réteg és a szegények között. A robotok itt vannak, meglátjuk mihez kezdünk velük (és ők mihez kezdenek velünk!)

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

CEU MicroData is hiring a junior programmer to perform text analytics tasks

2014.04.02. 08:00 Szerző: Zoltán Varjú Címkék: állás nyelvtechnológia CEU CEU Microdata

CEU MicroData is hiring a junior programmer to perform text analytics tasks. You would work with a team of faculty, programmers and research assistants to identify and match Hungarian firms and individuals by their name and address.

ceu_microdata.png

Required skills:

  • familiarity with standard Unix text processing tools

  • demonstrated expertise with a high-level programming language (preferably Python)

  • fluent Hungarian, conversational English

  • experience with text processing is a plus


You would be working 20 hours a week with flexible schedule. We are paying market wages and providing a better-than-market work environment.


If you are interested, please send your CV and samples of your programming work to Miklós Koren at korenm@ceu.hu.


CEU is an equal opportunity employer.

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Trading Consequences: gazdaságtörténet és nyelvtechnológia

2014.04.01. 08:00 Szerző: Zoltán Varjú Címkék: gazdaság gazdaságtörténet nyelvtechnológia digitális bölcsészet

Talán csak azok tudnak megúszni egy napot anélkül, hogy belefutnak a globalizáció szóba, akik egy lakatlan szigeten élnek (természetesen külön-külön mind érintett). A Trading Consequences projekt célja, hogy a fellelhető adatokat digitalizálva kutathatóvá tegye miképp alakult ki a globális kereskedelem - ehhez pedig számítógépes nyelvészek és gazdaságtörténészek együttműködése kellett!

tradingconsequences-banner.jpg

A Trading Consequences igazi interdiszciplináris projekt, a gazdaságtörténeti kutatást kanadai tudósok végzik, a nyelvtechnológiai hátteret pedig skóciai szakik biztosították. Az eredmény nem csak internetes felületen keresztül érhető el, hanem github-ról is mindenki letöltheti az adatokat és a kapcsolódó kódot is.

 

Az online felület elvileg négy szempont szerinti keresést tesz lehetővé, de ezek közül mi csak hármat találtunk működőképes állapotban; árucikkek és helyek szerinti keresés ill. a kettő együttes vizualizációja.

 

Az árucikk keresés során a keresőmezőbe gépelve keresési javaslatokat kapunk, ami kifejezetten hasznos tud lenni, mert nem olyan egyszerű egy árucikket hivatalos nevén nevezni. Az eredmények szűkíthetőek korpusz és év alapján, egy térképen pedig a kapcsolódó helyek is megjelennek.

tradingconsequences_commodity.png

Helyekre keresve meglepően jól szerepel az alkalmazás. Azonban a térképen csak a jelenlegi politikai határok láthatóak és nem derül ki, hogy egy-egy adott hely hova is tartozott egy adott időpontban. Az árucikkeknél is alkalmazott korpusz és évszám szerinti szűkítés itt is nagyon hasznos.

tradingconsequences_location.png

A Location Cloud Visualization néven emlegetett kereső megpróbálja emészthető formában tálalni a hely és árucikk alapú keresés eredményeit. Talán ez lehet a legfontosabb a téma iránt érdeklődők számára, sajnos azonban még nem olyan fejlett, mint az előző két megoldás. Egy kulcsszóhoz évtizedekre bontva jelennek meg a kapcsolódó földrajzi nevek, a szófelhőkből megszokott módon betűméretükkel jelezve frekvenciájukat. Ugyanakkor az árucikk mellett megadhatunk egy földrajzi nevet is másodlagos keresésnek, ez semmi mást nem tesz, mint kiemeli a találatot a szófelhőben. Láthatunk továbbá egy grafikont, ami a földrajzi név említésgyakoriságát jeleníti meg. Egy térképen pedig kontinensekre bontva láthatjuk az említések megoszlását. A projekt abszolút rajongói vagyunk az első perctől, de úgy gondoljuk van még mit dolgozni ezen az alkalmazáson.

2014-03-31 19.05.09.png

A Trading Consequences egyike az első olyan digitális bölcsészet projekteknek, melyek nagy mennyiségű történeti dokumentum feldolgozását teszik lehetővé. Az új módszerek eddig elérhetetlen perspektívát nyújtanak a kutatóknak s várhatóan izgalmas eredményekkel fognak szolgálni hamarosan. 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Elindult a kozbeszerzes.ceu.hu oldal

2014.03.25. 08:42 Szerző: Zoltán Varjú Címkék: data open data CEU Precognox kozbeszerzes.ceu.hu CEU Microdata

A CEU Department of Economics Koren Miklós és Szeidl Ádám által vezetett CEU Microdata kutatócsoportja elindította a kozbeszerzes.ceu.hu oldalt, ami a magyar közbeszerzési hirdetményeket teszi egyszerűen kereshetővé és elemezhetővé. 

ceu_microdata.png

A közbeszerzési hirdetmények sajnos strukturálatlan szöveges fájlok formájában kerülnek nyilvánosságra, ezek feldolgozását cégünk, a Precognox Kft. végezte. Büszkék vagyunk arra, hogy magyar kutatók nemzetközileg is elismert munkáját segíthetjük. Az adatok segítségével már most nagyon érdekes dolgokra derült fényt, pl. egy, az Indexen olvasható cikkben számoltak be arról, hogy a mindenki által sejtett közbeszerzési mutyi empirikusan is kimutatható.

kozbeszerzes.png

Maga az oldal egyszerű, könnyen kezelhető, nagyon hamar megismerhető. Akik szeretnék az adatokat letölteni, azok akár programmatikusan is megtehetik ezt, hiszen mindenkit arra ösztönöznek az üzemeltetők, hogy vigye magával robotját is az oldalra.

 

A CEU Microdata csoporttól további izgalmas projektek várhatóak még, melyeket izgatottan várunk. Sok sikert kívánunk a csapatnak!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Mi az a nowcasting?

2014.03.24. 10:31 Szerző: Zoltán Varjú Címkék: Google nowcasting GoogleTrends GoogleCorrelate

Egyik kedves olvasónk nekünk szegezte a kérdést, hogy akkor most mi ez a nowcasting őrület. A legegyszerűbb válasz az, hogy az ún. high-frequency real time, azaz nagyon gyorsan frissülő valós idejű adatok segítségével beleláthatunk a jelenbe. Ez elsőre nem tűnik egy nagy dobásnak, de gondoljunk bele abba, hogy a legtöbb gazdasági statisztikát havonta közlik, és általában bizonyos időközönként ki is igazítják a jelentéseket. Ilyen körülmények között nagyon hasznos lehet látni a pillanatnyi állapotot is, amire már lehet rövidtávú előrejelzést is adni. A hosszabb válaszhoz a mindenki által ismert Google eszközeit hívjuk segítségül.

gc01.PNG

A Google Trends eszközt nagyon sokan kedvelik, mivel betekintést nyújt egy-egy keresési kifejezés népszerűségébe és immár minden év végén szerepelnek a hírekben az ún. Zeitgeist helyezettek, azaz egy térség legnépszerűbb keresései. A Google kutatói 2009-ben a Nature-ben publikálták tanulmányukat arról, hogy eszközük az influenza trendek előrejelzésében is hasznosítható, s innét nem volt megállás.

 

A Google vezető közgazdásza Hal Varian szintén 2009-ben publikálta híres Predicting the Present with Google Trends című tanulmányát, ami a nowcasting irodalomban legtöbbet idézett mű lett. Varian kutatásai alapozták meg a Google Correlate eszközt, ami tkp. lehetővé teszi, hogy a felhasználó által megadott idősorhoz a Google Trends adataiból automatikusan megkapjuk azon idősorokat, melyek korrelálnak adatainkkal.

gc02.PNG

Habár fantasztikus eszközt adott kezünkbe a Google, nem árt megjegyezni, hogy maga Varian is arra ösztönöz mindenkit, akinek hasonló adatai vannak, hogy próbálják meg ezeket valahogy kombinálni. Sajnos/szerencsére azonban nehezen elképzelhető, hogy a hitelkártya adatok, vagy éppen a kiskereskedelmi forgalom adatai elérhetők lesznek mindenki számára. Azonban hatalmas mennyiségű adatot gyűjt immár a kormányzati szektor is, ezek általában amúgy is nyilvánosak, érdemes ezeket elérhetővé tenni, mivel így az ipar is növelheti hatékonyságát, továbbá a civil kontroll és a tudományos elemző munka eredményessége is növelhető így.

Érdemes megjegyezni, hogy a nowcasting területén alkalmazott korrelációs módszerek nem szólnak az okságról! Minden statisztika órán elhangzik, hogy a korreláció nem jelent okságot, a Wikipedia pedig külön szócikket szentel a "correlation does not imply causation" frázisnak. Ezért az ilyen vizsgálatokat fogadjuk egészséges szkepticizmussal!

cell_phones.png

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása