A bluefin labs-hoz hasonlóan a Luminoso is az MIT Media Lab spin-off vállalkozása. A cég a Common Sense Computing Initiative kutatási program eredményeire építve kínál szövegbányászati és szemantikus keresési megoldásokat webes szolgáltatás keretében.
A Common Sense Initiative a mesterséges intelligencia egyik atyjának, Marvin Minsky-nek, az alapötletén alapul, mely szerint ahhoz, hogy igazán intelligens gépeket tudjunk alkotni, először létre kellene hozni az "általános emberi intelligencia" modelljét. Ezzel tkp. a felvilágosodás korától egyre intenzívebben vizsgált józan ész (angolul common sense) formális leírására törekedett a csoport. Minsky szerint a józan ész fogalma nem szorul különösebb magyarázatra Descartes leírása nyomán:
A józan ész az a dolog, amely a legjobban oszlik meg az emberek között, mert mindenki azt hiszi, hogy annyit kapott belőle, hogy még azok sem szoktak maguknak többet kívánni, mint amennyijük van, akiket minden más dologban csak igen nehéz kielégíteni. S nem valószínű, hogy ebben mindenki téved; ez inkább azt bizonyítja, hogy az a képesség, amelynél fogva helyesen ítélünk és az igazat megkülönböztetjük a hamistól - s tulajdonképpen ez az, amit józan értelemnek vagy észnek nevezünk -, természettől fogva egyenlő minden emberben, úgyhogy véleményeink nem azért különböznek, mert egyesek eszesebbek másoknál, hanem azért, mert gondolatainkat különböző utakon vezetjük, s nem ugyanazokat a dolgokat nézzük. (Descartes: Értekezés a módszerről)
A józan ész tehát egy olyan mindennapi tudás, melyet nem tudatosan birtoklunk, de életünk legtriviálisabb helyzeteiben is használjuk. Pl. amikor azt halljuk egy Thaiföldről hazaérkező barátunktól, hogy "Tegnap visszaváltottam a megmaradt kétezer bahtomat hét forintos árfolyamon." ki tudjuk találni, hogy a baht a thai fizetőeszköz neve. Vegyük észre, hogy a legtöbb felnőtt erre anélkül is képes lenne, hogy ismerné a kontextust, amiben elhangzott a mondat. A Common Sense Initiative keretében készített ConceptNet ilyen relációkat gyűjtött össze az évek során egy online felület segítségével. Habár a legtöbb relációt az angol nyelvű felületet használók adták meg, több más nyelven (köztük van a magyar is!) folyt az adatfelvétel.
A ConceptNet legújabb kiadása az összegyűjtött adatokat kiegészítette más szemantikus adatbázisokkal is. A CommonSense Initiative honlapján elérhető az adatbázis egy kellően nagy részhalmaza, ill. Amazon Web Services-en elérhető instance-hez is található link.
A Luminoso tkp. a ConceptNet adatbázisára épít. Egyrészt a cég adatbázisa sokkal nagyobb, mivel tartalmaz nem nyilvános adathalmazokat is. Másrészt a spin-offba került a know-how, a ConceptNet elkészítésében és használatában gyakorlott csapat átvitte magával tapasztalatát.
A Luminoso szolgáltatásai első látásra alapvetően nem különböznek más szövegbányászattal foglalkozó cégek termékeitől; keresést és klasszifikációt kínálnak és természetesen skálázhatóságot, hogy a big data se maradjon ki a listájukról. A mögöttes módszerük azonban teljesen egyedi és meglepően jól alkalmazható a gyakorlatban. A ConceptNet-re építve tkp. azt keresik meg, hogy a beindexelt szövegek hogyan illeszkednek a már meglévő fogalmi hálójukba. Így a szemantikus keresést gyorsan tudják megvalósítani, hiszen a gyakorlattal ellentétben nem először építenek egy területspecifikus ontológiát vagy szótárat, hanem egy előzetes hierarchiát illesztenek a meglévő szövegekhez. A klasszifikációt is hasonlóan oldják meg, aminek előnye, hogy a létrejött csoportok egyértelműen valamilyen jelentéssel bírnak. Még nem érhető el szolgáltatásként, de már dolgoznak a hasonló elveken működő sentiment analysis (érzelmi viszonyulás vagy polaritás mérése) rendszeren is.
A ConceptNet hatalmas sikert aratott szakmai körökben annak ellenére, hogy korántsem divatos elvek mentén alakították ki. A Luminoso remek példája annak, hogy érdemes odafigyelni a fősodoron kívüli eljárásokra és elméletekre is.