HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

25 év Tankcsapda dalainak topik eloszlása

2014.07.21. 15:26 Szerző: Zoltán Varjú Címkék: tartalomelemzés Precognox lda topik modellek topics over time

Az ún topics over time módszer egy egyszerűsített változatával megnéztük hogyan alakul az lda-val kinyert topikok aránya a Tankcsapda elmúlt 25 évben megjelent stúdióalbumainak szövegeiben. Egy kis webes alkalmazásban elérhetővé is tettük eredményeinket itt.

tankcsapda.png

Az egyes topikok eloszlása a dokumentumok között elérhető ebben a táblázatban, a topikokhoz tartozó szavak pedig ebben. Az alkalmazás Eric Rochester Mastering Clojure Data Analysis c. könyvének harmadik fejezete alapján készült, a kód minimális változtatásával. A szövegeket a http://www.zeneszoveg.hu/ oldalról vettük.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

A politikai blogszféra I.

2014.07.19. 16:30 Szerző: Zoltán Varjú Címkék: szövegelemzés szövegbányászat hálózatelemzés Precognox Labs

Reméljük olvasóink elnézik nekünk hogy hanyagoltuk a posztolást mostanában. Van mentségünk! A magyar politikai blogokról kiindulva crawlerünk rengeteg oldalt gyűjtött be, mi pedig ezeket elkezdtük elemezgetni. Ebben a posztban csak ízelítőt adunk, az eredményekről hamarosan bővebben is beszámolunk. 

blogszfera_full.png

A linkek struktúráját vizsgálva látszik, erre a világra is érvényes a csokornyakkendő elrendeződés.

tld_cut.png

A wikipedia domainről gyűjtöttük be a legtöbb oldalt, mert oda mutat a legtöbb link - ellenben minden másra jóval kevesebb link mutat. A wikipedia után jön a blog.hu, az hvg és az index, majd a Facebook és a Youtube és pár hazai és külföldi online lap.

lda01.png

A crawler által vizsgált oldalak szövegeit begyűjtöttük, tuti ami fix már egy LDA elemzést is futtattunk rajtuk.

 

Sorozatunkban megpróbáljuk leírni a magyar politikai blogszféra topológiáját, megnézzük mennyire kapcsolódik össze a blogokról induló linkek struktúrája, milyen érzelmi viszonyulással linkelik egymást az oldalak  stb. Hamarosan folyt.köv.!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Good Math - logika, számításelmélet és matek érdekesen tálalva

2014.07.02. 13:27 Szerző: Zoltán Varjú Címkék: matek könyvajánló logika számítástudomány

Mik is azok a számok, mi az a Turing-gép, milyen problémákat tudunk számítógépek segítségével eldönteni? Megannyi nehéz kérdés, melyekre egy rövid könyvben találjuk meg a válaszokat. Mielőtt azt hinné valaki, hogy ez bizony nehéz olvasmány lesz, megnyugtatunk mindenkit; józan paraszti észnél több nem kell ahhoz, hogy ezen problémákon elgondolkodjunk a Good Math, A Geek's Guide to the Beauty of Numbers, Logic, and Computation segítségével.

good_math.jpg

Akit szimplán csak érdekel a számítástudomány és a matematika kapcsolata, az nem fog csalódni! Mark Chu-Carrol Good Math, Bad Math blogjának olvasói azonban tudják, a szerző szereti kódokkal is megtámogatni mondandóját, s a kötetben sincs ez másképp. Nincs minden fejezetben kód, sőt, alig-alig akad benne ilyen, de ahol van, ott nagyon jól illeszkedik a tartalomhoz. Persze azok akik nem szeretnek, vagy nem tudnak programozni nyugodtan átugorhatják azt a néhány kódolós részt, nem veszítenek semmit. És ez a legjobb a kötetben! Egyrészt olvasható úgyis, mint egy ismeretterjesztő könyv. Másrészt egy amolyan útmutató a manapság divatos témák között, típuselmélet, lambda kalkulus, Turing-gépek, véges állapotú automaták és a bestiárium összes alakja felsorakozik benne, de egyáltalán nem rémisztő alakban. Az egyes fejezetek alig pár oldalasak, könnyen olvashatóak, azonban mint minden matek/technikai könyv esetében illik időt szánni a felvetett problémák megemésztésére.

 

A funkcionális nyelvek iránt érdeklődőknek ez a könyv kötelező darab, mindenki másnak pedig remek szórakozást jelenthet eltölteni vele pár órát. Egyedül a Kindle verzióval van problémám, ami nem barátja a matematikai képleteknek, kódrészleteknek és a nagyobb ábráknak. Ajánlott az elektronikus verziót közvetlenül a kiadótól megvásárolni, mivel nem kérnek külön pénzt a különböző formátumokért.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

NLP matiné slideok

2014.06.29. 17:31 Szerző: Zoltán Varjú Címkék: Neticle nyest.hu Precognox Gravity Meltwater PPKE ITK Nyelvtechnológiai Labor Radoop RapidMiner

A héten zártuk a meetup szezont, szeptemberig most elvonulunk pihenni. Addig pedig itt vannak az NLP matiné slideok, tessék szépen átnézni ezeket, sok cégnél akad nyitott pozíció!!!!!

 

Gravity R&D Zrt. 

Meltwater

 

Precognox

 

MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport 

 

Neticle

 

 Radoop (RapidMiner)

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Quixey - kereső a mobil-kornak

2014.06.23. 08:00 Szerző: Zoltán Varjú Címkék: mobil keresés Quixey

Lassan három éve, hogy beszámoltunk a Quixey appkeresőjéről, azóta a cég terméke szépen kiforrott és úgy tűnik új utakat keres magának a lelkes csapat. A Technology Reiew cikke szerint a cél immáron a mobilok uralta net kereshetővé tétele. Ja, hogy erre ott a Google? Nem feltétlenül! Van mit keresni még ezen a piacon!

 

Ma már mindenre van app, a Quixey pont egy olyan app ami a több között segít keresni. A mobil net apposodásának köszönhetően azonban az információ silósodik, egyedi alkalmazásokban tárolódnak el információk és amikor keresni akarunk, lehet hogy ezek egyvelege jelentené a megoldást. Mi van ha keresünk egy kellemes könyvesboltot, jó kávézóval a közelben? A GoogleMaps biztos tud ajánlani egyet (ha kellően nagy városban vagyunk), de milyen jó lenne tudni, hogy barátaink mit gondolnak az adott helyről! Böngésszük végig a Twitter-t és a Facebook-ot egyaránt érte? Elmentettünk egy cikket a helyi könyvesboltokról kedvenc lapunk appjában, ez rémlik, de azóta még ezer meg egy cikket megjelöltünk, hogyan hívjuk elő? Az appkeresésben szerzett tapasztalatára építve itt szeretne a Quixey belépni a képbe.

quixey.2x299.png

Sajnos nem olyan egyszerű hozzáférni az appokban tárolt információkhoz, ezért a Quixey fejlesztői szeretnék, ha az appok írói ún. deep linkek segítségével elérhetővé tennék számukra ezeket. Ehhez innét kívánunk sok szerencsét, látva, hogy a szemantikus web fantasztikus ötlete 15 éve nem terjedt el, pedig az is csak pár kód beszúrását kéri a fejlesztőktől. A nehézségek ellenére annyi biztos, hogy remekül azonosítottak a fejlesztők egy problémát és mindenki (legalábbis a felhasználóknak biztosan) érdeke, hogy a web továbbra is kereshető maradjon - a mobilok korában pedig az apposodás ennek lehet akadálya, de akár támogatója is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása