A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.
Az alábbi keresődobozsegítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.
Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.
Precognox Blogkereső
Document
opendata.hu
Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.
A long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...
A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft.Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.
Amíg mások csak beszélnek arról, hogy a deep learning a jövő még a mobilokon is, meg hogy újra kell gondolni az ember-gép interakciót, addig a SwiftKey kiadta mobil billentyűzetének új változatát, melynek motorja egy neurális háló.
A Neural Alpha jelenleg csak angol nyelvre érhető el. A "hagyományos" SwiftKey keyboarddal ellentétben nem ngram modellen alapul, hanem deep neural net model-t használ. A megközelítés előnye, hogy nem pusztán statisztikai alapon képes a következő elem megtippelésére, hanem az adott kontextust is figyelembe veszi. Saját tapasztalatunk szerint nem véletlenül Alpha státuszú még az app; nagyon könnyű volt olyan példát találni (egy cikk a The Economist-ból), amin nem boldogult jól.
Ugyanazon a szövegen a "hagyományos" billentyűzet egy kicsit gyorsabbnak bizonyult, ellenben a többnyelvűség miatt sokszor magyar ajánlatokat adott, továbbá a szövegben maradt egy typo!
Összességében elmondható, hogy a Neural Alpha nagyon ígéretes. Talán egy picivel lassabb mint elődje és fájóan egynyelvű, azonban ha nem újságcikket akarunk begépelni vele, hanem hétköznapi helyzetekben használjuk (email írás, chatelés, tweetelés, stb.), akkor nagyon kényelmes és gyors gépelést tesz lehetővé.
Úgy tűnik itt az ideje átismételni amit a neural network language modellekről tudnunk kell!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Idén immár másodszor került megrendezésre hackathon a K-Monitor Adatozz okosan programjának keretében, amin munkatársaink mint mentorok vettek részt és ismét precognoxos által mentorált csapat nyerte a versenyt.
A Születésház Egyesület első helyezést ért el, a csapat tagjai; Schmidt Erika, Hudy Róbert, és Balogh Kitti kollégánk. Gratulálunk!
A K-Monitortól Koncsik Anitát Varjú Zoltán kollégánk segítette.
Kaptunk egy szép oklevelet is a részvételért :D
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Mik azok a neurális hálózatok, hogyan tanulnak meg mitől deep a deep learning? Nehéz kérdések ez, főleg ingyenes forrásokat ajánlunk megválaszolásukhoz.
Ez az öreg kis könyvecske már generációkat vezetett be az elmefilozófia és a kognitív tudomány kérdéseibe. Aki nem szereti a filozófiai hátteret, annak érdemes csak a hatodik (AI) és hetedik (Neuroscience) fejezeteket elolvasni, mert ezeknél világosabban eddig még senki sem tudta elmondani hogy mi az a neurális háló, hogyan tanul, meg mi köze van az emberi agyhoz.
Öreg, szép vastag könyv, ami azért már bele-bele megy a technikai részletekbe. Computational Neuroscience könyvnek szánták, de igazából valahogy a neurális hálókkal foglalkozók körében lett népszerű. A legfontosabb fejezetei elérhetőek online:
Aki szeret kódolni, annak ez az ingyenesen elérhető könyv nagyon hasznos lehet. Sajnos nem igazán foglalkozik sokat az elméleti háttérrel, ellenben igazán jó példákon keresztül ismerhetünk meg pár bevett technikát a segítségével.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Ma a MIBE konferenciáján velünk is találkozhattok, a részletes program itt található, alább pedig a slideok és válogatás korábbi, a témához kapcsolódó posztjainkból.
Kiszámíthatóak vagyunk? - Barabási Popper ellenes kirohanásairól írtunk ebben a posztban, meg Soros reflexivitás elméletéről
Ráfázhatsz a big data elemzésével - Garry King és társainak tanulmányát mutatjuk be röviden. A "haszontalan" társadalomtudósoknak köszönhetően a Flu Trends már nem működik, a Google belátta, kellenek neki más adatok is.
Politikai blogokkal foglalkozó projektünkről sokat írtunk, a tag linkjéről elérhető az összes poszt
Az emócióelemzésről is sokat írtunk, ezen posztok innen érhetőek el könnyen
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Stelarc egyedi performanszaival az emberi test és elme kiterjesztésének lehetőségeit feszegeti. Az ausztrál művész projektjei futurisztikusnak tűnnek. Sokan idegenkednénk egy robotvégtagtól, vagy egy agyi implantátumtól. Andy Clark szavaival élve született kiborgok vagyunk és természetünk része, hogy tárgyak használatával, vagy más emberek segítségével kiterjesztjük elménket és testünket. Mi pontosan ezen tulajdonságunkat kihasználva szeretnénk segíteni az olvasási nehézségekkel küzdőknek.
Elmosódó határok
A fejünkben gondolkodunk, számolunk, tervezgetünk, mérlegelünk. A koponyánkban ott van az agyunk, ami elvégzi ezt a sok műveletet. Ha az agyunk beszélni tudna, elmondaná nekünk, hogy baromira keveset tudunk arról mit is művel ő (akit érdekel, az itt elolvashatja mit mondana nekünk egy agy erről). De tényleg a fejünkben élünk? Szoktunk még úgy igazán fejben számolni? Ha nincs a kezünk ügyében egy mobil, egy számológép vagy egyéb elektronikus segédeszköz, akkor keresünk egy papírt meg egy tollat és nagyobb számokat bizony írásban adunk össze. Egyes műveleteket fejben végzünk, a részeredményeket papírra vetjük. Mondhatjuk, csak külső tárnak használjuk a papírt, de sokkal inkább interakcióba lépünk a külső elemekkel, hiszen a számolás műveletének szükséges része a papír és a toll használata. A kiterjesztett elme elmélete arra mutat rá, hogy az ember természete szerint rendszeresen használ külső tárakat, vagy akár éppen szervez ki teljes műveletek a világba.
A nyelv rajtunk túl van
A nyelvhasználat az emberi nem egyedi jellemzője, eredetéről és funkciójáról a tudományos gondolkodás kezdetei óta ádáz viták folynak, melyek valószínűleg soha sem fognak dűlőre jutni. Clark zseniális esszéjében arra mutat rá, hogy a nyelv egyrészt amolyan metarendszerként is szolgálhat számunkra. Ez a metarendszer segít az elme adott állapotait "megfagyasztani" és vizsgálat tárgyává tenni. A belső beszéd (amikor agyalunk egy dolgon) ennek megnyilvánulása. A sok "most mit tegyek", vagy "miért nem hív fel" és egyéb problémák belső hadarása nem csak fárasztó lehet, de éppen segíthet saját magunk tapasztalatainak megértésében, strukturálásában. Folytatunk magunkkal dialógusokat is, pl: "Miért nem mondtam fel, amikor nekem adták ezt a kellemetlen feladatot? - Mert nagyon szereted a munkatársaidat te hülye!"
A belső beszéd könnyen külsővé tehető. Saját magunk helyett mással is megbeszélhetjük gondjainkat, mások tapasztalatáról is tudomást szerezhetünk. Az írás megjelenésével több ezer éve élt emberek gondolataival ismerkedhetünk meg. Az internet lehetővé teszi pl, hogy a világ különböző pontjain élő programozók a StackOverflow platformon tegyenek fel kérdéseket egymásnak és kapjanak választ egymástól. A nyelvhasználat során "használjuk" a többi embert is.
Az, hogy a nyelvhasználat során kiterjesztjük elménket, az írott nyelv estében ez még nyilvánvalóbb. Amikor elkezdtem írni ezt a posztot, akkor elővettem a jegyzeteimet, újra olvastam a hivatkozott tanulmányokat, elbeszélgettem az irodán a kollégáimmal, elkészítettem egy vázlatot, átírtam, majd megint átírtam. Nem lineárisan szerkesztődik a szöveg, belepillantok a jegyzeteimbe, visszaolvasom mit írtam eddig, vitatkozok magammal. A szöveg nem a fejemben, hanem a gépen születik meg, a folyamat integráns része, hogy egyes elemei rajtam kívül vannak.
Clark esszéjének zsenialitása abban rejlik, hogy ő az első aki kimondja, a nyelvhasználat komputációs struktúrájának része, hogy kiterjesztjük elménket. A legtöbb nyelvmodell nem veszi figyelembe ezt, vagy az egyed felől közelíti meg a nyelvleírást, vagy a társadalmi szint felől. A két szint megkülönböztetése azonban lehetetlen, egy térben vannak.
A gráfok és az asszisztív technológia
Úgy gondoljuk, az olvasási nehézségekkel küzdőknek segítségre van szükségük abban, hogy elméjüket hatékonyan tudják kiterjeszteni. A kognitív tudományokban egyre elterjedtebb a hálózatelméleti megközelítés, mind az egyed, mind a társadalom szintjén; az agyi hálózatoktól kedve, a szövegek struktúráját feltáró hálózatokon át a komplex nyelvi hálózatokig bezárólag. Saját kis projektjeink is megerősítettek abban, hogy a nyelvvel kapcsolatos vizsgálatokban bizony jó szolgálatot tehetnek a gráfok! Nézzük melyek ezek a területek:
Korábbi, politikai tartalomelemzéssel kapcsolatos posztjainkban már mutattunk a gráf-alapú TextRank algoritmus segítségével készített szógráfokat egy-egy szövegről (l. itt és itt). Egy belső projekt kapcsán módosítottuk egy kicsit az eredeti algoritmust. Ekkor akadt kezünkbe egy tanulmány arról, hogy az automatikusan kinyert kulcsszavak kiemelése a szövegekben segíti a diszlexiások szövegértését. Úgy döntöttünk, alaposan kiértékeljük algoritmusunkat és azt hamarosan olvasási vizsgálatokban is bevetjük, hogy lássuk, tudunk-e használható megoldást kínálni az olvasási nehézségekkel küzdőknek. A projektről igyekszünk folyamatosan beszámolni olvasóinknak. Hamarosan folyt.köv!
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.