HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Precognox Labs - Entity Extractor

2013.09.10. 08:00 Szerző: Zoltán Varjú Címkék: ner Precognox Labs named entity recognition

A névvel rendelkező entitások felismerése (named entity recogniton, röviden NER) napjainkban a szövegfeldolgozás egyik kedvelt területe. Fodor Mánuel gyakornokunk egy egyszerű, általános célú NER rendszer kifejlesztésébe kapcsolódott be miután elkészítette beszédfelismerős cégkeresőnk prototípusát.

Az Entity Extractor demo felületén egy url-t adhatunk meg.

ner01.PNG

Az eszköz Text Extractor alkalmazásunkat használva képes az adott honlapon azonosítani a "törzsszöveget".

ner02.PNG

Jelenleg kb. 80%-os pontossággal képes azonosítani a szövegben szereplő entitásokat (személyek, szervezetek, helyek és egyéb kategóriákba sorolva).

ner03.png

A fejlesztés célja, hogy tovább növeljük az eszköz hatékonyságát, ill. szeretnénk az entitások közötti kapcsolatokat is felismerni.

Az Entity Extractor jelenleg még nem érhető el szabadon, de kérésre nagyon szívesen megmutatjuk működés közben is.

Ha jövő nyáron te is szívesen lennél gyakornok a Precognoxnál, jelentkezz már most! Maximum három személyt tudunk fogadni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Precognox Labs - Text Extractor

2013.09.09. 08:00 Szerző: Zoltán Varjú Címkék: szövegelemzés Precognox Labs Text Extractor szövegkinyerés

Egy korábbi posztunkban megemlékeztünk arról, mennyire nehéz csupán a tartalmilag releváns szövegeket kiszedni egy weblapból. Kulcsár Ádám gyakornokunk a hivatkozott bejegyzés nyomán készítette el Text Extractor alkalmazásunkat, ami egy megadott url alapján képes kinyerni a tartalomelemzés számára releváns szöveges tartalmat egy adott honlapról.

textextractor_1.PNG

A demo alkalmazás kezelőfelülete nagyon egyszerű, a beviteli mezőbe meg kell adnunk egy url-t.

textextractor02_1.PNG

Az eredmény pedig a szövegelemzés szempontjából releváns tartalom.

textextractor03.png

Habár elvileg nagyon egyszerű dolog lenne szintaktikai elemzéssel felismerni egy html oldalban a releváns részeket, a gyakorlat azt mutatja, hogy a webfejlesztőket nem igazán érdeklik a szabványok. A Text Extractor ezért nem a hagyományos parsing megközelítést használja, hanem gépi tanuláson alapuló modell alapján választja ki a szöveget.

Az alkalmazás nem érhető el szabadon, de igény esetén nagyon szívesen megmutatjuk!

Ha jövő nyáron te is szívesen lennél gyakornok a Precognoxnál, jelentkezz már most! Maximum három személyt tudunk fogadni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

Az opendata.hu tesztelőket keres!

2013.09.06. 08:00 Szerző: Zoltán Varjú Címkék: önkéntes open data ckan

Cégünk egy a nyílt adatokat kereshetővé tévő CKAN szerver felállításával és üzemeltetésével szeretne hozzájárulni a magyar open data mozgalom sikerességéhez. Jelenleg a rendszer tesztelés alatt áll,  de szívesen biztosítunk hozzáférést bárkinek, aki szeretne adatokat feltölteni, vagy linkelni. 

ckan-logo.png

A CKAN szerver elsődleges célja, hogy kereshetővé tegye az elérhető nyílt adatokat. Lehetőség van csupán az adatok forrásának linkelésére és egy rövid leírás megadására is, illetve fel is tölthetők az adathalmazok a szerverre. Jelenleg csupán pár adathalmaz érhető el a szerveren, ezek számát szeretnénk jelentősen növelni mielőtt publikussá válik az oldal. Továbbá reméljük, hogy az esetleges hibákra is fény derül a tesztüzem során.

Tesztelésre egy a zoltan.varju(kukac)precognox.com e-mail címre küldött e-maillel lehet jelentkezni, a tárgyban a "CKAN" feltüntetésével.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Legyél az NLP meetup szervezője!

2013.09.05. 08:00 Szerző: Zoltán Varjú Címkék: önkéntes NLP meetup

Az NLP meetup segítőket keres! Általában évi hat alkalommal kerül megrendezésre a meetup, mely lebonyolításában eddig Kádár Ákos és Recsik Gábor segített - amit ezúton is köszönünk nekik. A segítőre váró feladatok sokszínűek, olyan kreatív tevékenységeket fednek le mint székpakolás, a vendégek fogadása és útbaigazítása, egy-egy esemény lebonyolítása, előadók meghívása stb. Ezek jelentős része helyhez kötött, mivel Budapesten tartjuk rendezvényeinket.

logo9_final.jpg

Amennyiben szeretnél csatlakozni a szervezőkhöz, írj magadról pár sort a zoltan.varju(kukac)precognox.com címre, a tárgymezőbe írd be, hogy "NLP meetup segítő". Ellentételezéssel nem tudunk szolgálni, de mint segítő megismerheted a hazai és részben a nemzetközi szakmai élet szereplőit, kapcsolatba kerülhetsz kutatókkal és az iparral is. Szükség esetén nagyon szép ajánlásokat tudunk írni! Továbbá írhatsz a Kereső Világra, amit kétszer is a harmadik legjobb IT blognak választott a Goldenblog zsűrije és idén ott van a tíz legjobb biznisz blog között. Médiapartnerünk a Nyelv és Tudomány rendszeresen megkörnyékezi tagjainkat, hogy írjanak nekik szakterületükről. Az sem utolsó szempont, hogy a lelkes segítő úgy jelentkezhet gyakornoki programunkra, hogy már ismerjük.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

ePSI Platform Workshop - 2013. október 2, Budapest

2013.09.04. 08:00 Szerző: Zoltán Varjú Címkék: konferencia open data ePSIplatform

A nyílt adatok iránt érdeklődők számára igazi csemege lesz az ePSIplatfrom október 2-án megrendezésre kerülő workshopja. A részvétel ingyenes, de előzetes Eventbrite regisztrációhoz kötött. A részletes program ezen a linken érhető el.

 

epsi.png


A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása