HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Luminoso - a józan ész fényénél

2012.09.25. 12:00 Szerző: Zoltán Varjú Címkék: keresés common sense szemantikus keresés nyelvtechnológia Luminoso ConcepNet Marvin Minsky

A bluefin labs-hoz hasonlóan a Luminoso is az MIT Media Lab spin-off vállalkozása. A cég a Common Sense Computing Initiative kutatási program eredményeire építve kínál szövegbányászati és szemantikus keresési megoldásokat webes szolgáltatás keretében.

luminoso01.png

A Common Sense Initiative a mesterséges intelligencia egyik atyjának, Marvin Minsky-nek, az alapötletén alapul, mely szerint ahhoz, hogy igazán intelligens gépeket tudjunk alkotni, először létre kellene hozni az "általános emberi intelligencia" modelljét. Ezzel tkp. a felvilágosodás korától egyre intenzívebben vizsgált józan ész (angolul common sense) formális leírására törekedett a csoport. Minsky szerint a józan ész fogalma nem szorul különösebb magyarázatra Descartes leírása nyomán:

descartes.jpg

A józan ész az a dolog, amely a legjobban oszlik meg az emberek között, mert mindenki azt hiszi, hogy annyit kapott belőle, hogy még azok sem szoktak maguknak többet kívánni, mint amennyijük van, akiket minden más dologban csak igen nehéz kielégíteni. S nem valószínű, hogy ebben mindenki téved; ez inkább azt bizonyítja, hogy az a képesség, amelynél fogva helyesen ítélünk és az igazat megkülönböztetjük a hamistól - s tulajdonképpen ez az, amit józan értelemnek vagy észnek nevezünk -, természettől fogva egyenlő minden emberben, úgyhogy véleményeink nem azért különböznek, mert egyesek eszesebbek másoknál, hanem azért, mert gondolatainkat különböző utakon vezetjük, s nem ugyanazokat a dolgokat nézzük. (Descartes: Értekezés a módszerről)

A józan ész tehát egy olyan mindennapi tudás, melyet nem tudatosan birtoklunk, de életünk legtriviálisabb helyzeteiben is használjuk. Pl. amikor azt halljuk egy Thaiföldről hazaérkező barátunktól, hogy "Tegnap visszaváltottam a megmaradt kétezer bahtomat hét forintos árfolyamon." ki tudjuk találni, hogy a baht a thai fizetőeszköz neve. Vegyük észre, hogy a legtöbb felnőtt erre anélkül is képes lenne, hogy ismerné a kontextust, amiben elhangzott a mondat. A Common Sense Initiative keretében készített ConceptNet ilyen relációkat gyűjtött össze az évek során egy online felület segítségével. Habár a legtöbb relációt az angol nyelvű felületet használók adták meg, több más nyelven (köztük van a magyar is!) folyt az adatfelvétel.

A ConceptNet legújabb kiadása az összegyűjtött adatokat kiegészítette más szemantikus adatbázisokkal is. A CommonSense Initiative honlapján elérhető az adatbázis egy kellően nagy részhalmaza, ill. Amazon Web Services-en elérhető instance-hez is található link.

A Luminoso tkp. a ConceptNet adatbázisára épít. Egyrészt a cég adatbázisa sokkal nagyobb, mivel tartalmaz nem nyilvános adathalmazokat is. Másrészt a spin-offba került a know-how, a ConceptNet elkészítésében és használatában gyakorlott csapat átvitte magával tapasztalatát.

A Luminoso szolgáltatásai első látásra alapvetően nem különböznek más szövegbányászattal foglalkozó cégek termékeitől; keresést és klasszifikációt kínálnak és természetesen skálázhatóságot, hogy a big data se maradjon ki a listájukról. A mögöttes módszerük azonban teljesen egyedi és meglepően jól alkalmazható a gyakorlatban. A ConceptNet-re építve tkp. azt keresik meg, hogy a beindexelt szövegek hogyan illeszkednek a már meglévő fogalmi hálójukba. Így a szemantikus keresést gyorsan tudják megvalósítani, hiszen a gyakorlattal ellentétben nem először építenek egy területspecifikus ontológiát vagy szótárat, hanem egy előzetes hierarchiát illesztenek a meglévő szövegekhez. A klasszifikációt is hasonlóan oldják meg, aminek előnye, hogy a létrejött csoportok egyértelműen valamilyen jelentéssel bírnak. Még nem érhető el szolgáltatásként, de már dolgoznak a hasonló elveken működő sentiment analysis (érzelmi viszonyulás vagy polaritás mérése) rendszeren is.

A ConceptNet hatalmas sikert aratott szakmai körökben annak ellenére, hogy korántsem divatos elvek mentén alakították ki. A Luminoso remek példája annak, hogy érdemes odafigyelni a fősodoron kívüli eljárásokra és elméletekre is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr464787776

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása