A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.
Az alábbi keresődobozsegítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.
Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.
Precognox Blogkereső
Document
opendata.hu
Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.
A long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...
A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft.Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.
Pénteken Orbán Viktor az elmúlt öt év kormányzati munkáját fogja értékelni. A hírről a hagyományos országértékelő beszédek jutnak eszünkbe óhatatlanul. Ezekből már van tizenhét, melyeket a Nyelv és Tudománnyal közös projektünk keretében begyűjtöttünk és megvizsgáltunk.
Leggyakoribb szavak
...
Kulcsszavak
...
Szógráfok
...
Topikok
Szavak
Hogy készült?
A szövegeket kitisztítottuk (minden írásjeltől, számtól és nem betűnek számító karaktertől), csupa kisbetűsre hoztuk, majd szótöveztük és végül a stopszavakat (kötőszavak, névelők, stb.) kiszűrtük. Az így kapott korpuszon számoltunk szógyakoriságot. Az egész korpuszt használva az egyes évek beszédeinek kulcsszavait khí-négyzetes módszerrel kerestük meg. A szógráfokat TextRank eljárással generáltuk. A topikokat látens Dirichet allokációval állítottuk elő. A szavakat Ward-módszerrel rendeztük hierarchikus klaszterekbe.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.