HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Shrine of Jura: The best friend of our developers

2014.09.23. 09:24 Szerző: kereso Címkék: instagram

10707111_798170893566307_27581603_n.jpg_612x612

precognox készítette ezt a képet.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

The team learns about lazy loading in todays fast workshop

2014.09.23. 08:44 Szerző: kereso Címkék: instagram

10707047_849535241752655_16644331_n.jpg_612x612

precognox készítette ezt a képet.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

MOOC ajánló: Corpus Linguistics: Method, Analysis, Interpretation

2014.09.22. 08:00 Szerző: zoltanvarju Címkék: korpusznyelvészet MOOC

Már csak hét nap és indul a Future Learn Corpus Linguistics: Method, Analysis, Interpretation kurzusa! Az ajánló szerint elvégzéséhez nem kell más mint "an interest in the study of language, there are no requirements to join this course" - ezért bátran ajánlhatjuk mindenkinek, akit érdekel a nyelv statisztikai leírása. Nem mellesleg McEnry-től, a szakma legjobbjától sajátíthatjuk el az alapokat!!!!

 

A tematika alapján kb. fele-fele arányban lesz klasszikus korpusznyelvészet (technikai és metodológiai alapok) és alkalmazott korpusznyelvészet (a diskurzuselemzés és az igazságügyi nyelvészet kifejezetten izgalmasnak ígérkezik).

Week 1: An Introduction to Corpus Linguistics
Week 2: A Look at Language – Some Key Methods in Corpus Linguistics
Week 3: Compare and Contrast – Corpus-Based Discourse Analysis
Week 4: Build a Corpus
Week 5: Looking at Social Issues Through Corpora: Forensic Linguistics
Week 6: Textbook and Dictionary Construction
Week 7: Language Learning and Corpus Linguistics
Week 8: Speech – a Swearing Extravaganza

Az előadó neve garancia arra, hogy naprakész tananyaggal találkozhatunk a kurzus során. McEnry a legjobb tankönyvek szerzője (vagy társszerzője) a területen, személyes kedvencemet tőle máshol már ajánlottam is.

 

Habár a programozás manapság elválaszthatatlan a korpusznyelvészettől, sajnos a kurzus nem vállalkozik arra, hogy foglalkozzon ezzel a témával is. Ez nem feltétlenül baj, hiszen két terület összekapcsolása lehet csak nehezítené az anyag megértését. Remélem sokan fognak kedvet kapni a nyelvi adatok felfedezéséhez a kurzus elvégzése után, nekik nem marad más választásuk; meg kell tanulniuk programozni! A kurzus után, vagy ha már tisztában van valaki a nyelvészeti alapokkal akár helyett, a további lépésekben a Satistics and R for Linguists - a reading list nyújthat segítséget.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Október 16: e-Kormányzat Műhelykonferencia és Budapest Open Knowledge Meetup

2014.09.19. 14:25 Szerző: zoltanvarju Címkék: konferencia meetup open knowledge

A W3C Magyar Iroda e-Kormányzat témában műhelykonferenciát rendez 2014. október 16-án, 14.00-től az MTA SZTAKI-ban (1111 Budapest, Kende u. 13-17.). További részletek itt. A részvétel ingyenes, de regisztrációhoz kötött!

wordcloudgovfresh.jpg

A konferencia után Budapest Open Kowledge Meetup-ot tartunk, amire pedig itt lehet regisztrálni, szintén ingyen :D

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Vendégposzt: Slamby, világklasszis értelmező technológia

2014.09.18. 13:22 Szerző: zoltanvarju Címkék: vendégposzt nyelvtechnológia big data Slamby

Tóth László írása

A világon naponta, átlagosan 2,5 milliárd gigabájtnyi adat termelődik, aminek 75%-a strukturálatlan írott szöveg vagy hang és videofelvétel. A Slamby küldetése az, hogy ezt a strukturálatlan írott adatmennyiséget értelmezze, és a cégek számára felhasználható formájúvá tegye.

slamby.logo.png

A Slamby text adatok értelmezését teszi lehetővé, és az értelmezés eredményétől függően képes feladatok végrehajtására. Mindezt automatikusan, öntanuló technológiával és nyelvfüggetlenül. Mit is jelent ez?

Képzeljünk el egy olyan call centert, ügyfélközpontot, ahová az egy központi címre naponta beérkező több tízezer email-t képesek vagyunk 1 századmásodperc alatt automatikusan elolvasni, értelmezni és azt a megfelelő ügyfélszolgálatos kollégának továbbítani, vagy akár automatikusan megválaszolni. Így az ügyfélszolgálat reakcióideje 1 napról akár pár percre vagy órára csökkenhet. Egy ideges és mérges ügyfél kezelésénél ez nem egy elhanyagolható előny.

Sőt, menjünk tovább, és képzeljük el, hogy van egy olyan speach recorder, ami a telefonbeszélgetéseket írott szöveggé alakítja. Senki nem képes a telefonbeszélgetéseket elemezni, de ha le van írva, akkor a Slamby igen. Képes arra, hogy megmondja melyik kolléga kezelte hatékonyan vagy kevésbé hatékonyan az ügyfelet, ki az, akinek sikerült a problémáját hibátlanul megoldani, ki az akinek nem, vagy épp ki beszélt nem elfogadható hangnemben (értsd anyázott) az ügyféllel. De a telefonbeszélgetések és beérkező email-ek elemzése alapján az is megmondható, hogy a felhasználóknak valós időben milyen problémáik vannak, amiket a cégnek sürgősen meg kell oldania. Ez jelenleg csak akkor lenne lehetséges, ha egy ember naponta minden beérkező email-t és telefonbeszélgetést elolvasna, értelmezne, kivonatolva, összesítene, jah, és nem felejtené el mit olvasott 3425 dokumentummal azelőtt aznap...

De ez csak egy példa volt. A text adatok (text big data?) feldolgozásában, értelmezésében, és a vállalatok szolgálatába állításában hihetetlenül nagy lehetőségek rejlenek.

A Slamby technológiájával eddig az alábbi problémákra sikerült megoldást szállítanunk, az utóbbi fél évben:
● Egy nagyvállalat üzleti titkainak, adatainak szivárogtatását gátló szoftvert szállítottunk, mely arra is képes, hogy a kikerült adatok alapján megtalálja ki lehetett a szivárogtató
● Egy egyetemi könyvtár számára a beérkező írott dokumentumok szortírozására, dolgozatok automatikus címkézésére adunk megoldást, illetve egy plágium detektáló szoftvert is készítünk a technológiával.

A Slamby célja, hogy egyre több nagyvállalat text data-val kapcsolatos problémáját oldja meg, és tegye hatékonyabbá, eredményesebbé a működésüket.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre