HTML

Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Váltsunk együtt paradigmát a nyílt tudománnyal!

2015.01.27. 10:32 Szerző: zoltanvarju Címkék: open access open data citizen science R Python open knowledge open science

Miközben a magyar (és úgy általában a világ kevésbé eleresztett felén élő) tudósok kalózkodásra kényszerülnek, hogy képben legyenek a kurrens szakirodalommal, a nagy szaklapokban egyre több kétes tanulmány kerül be és egyre többen aggódnak a tudományos munka minősége miatt. Mindkét problémára megoldás a nyílt tudomány!

Mi a probléma?

Az áltudományos szövegek generálása lassan külön sporttá vált, s nem is olyan régen a Springer és az IEEE több mint 120 darab cikket vont vissza, mert bebizonyosodott hogy gépileg generált nonszensz a tartalmuk. Christopher Chabris és tsai az általános intelligencia genetikai hátterét vizsgáló kutatásokat elemezve arra jutottak, hogy a legtöbb feltételezett asszociáció valószínűleg hamis. A pszichológusok egyik kedvenc kísérleti eljárása az előfeszítés (priming), de az utóbbi időben az ilyen eljárást alkalmazó kutatások jelentős részéről bebizonyosodott hogy nem megismételhetőek.

 priming.jpg

Úgy tűnik, a tudományt remekül szolgáló peer review rendszer nem működik igazán. A fenti hibák nem jelentik azt, hogy a tudományos tudás leértékelődött, vagy hogy el kellene vetnünk. A megoldást sokan a nyílt adatokban, a kutatáshoz kapcsolódó workflow-k és szoftverek megosztásában és a beszámolók szabad közlésében látják.

Hol érdemes kezdeni?

  • Mozilla Science Lab

mozillascience.png

A Mozilla Science Lab különböző tudományterületeknek készít szoftvereket, nagyon aktívak a tudásmegosztás terén. A tudományos programozással foglalkozók és/vagy pythonisták körében régóta népszerű Software Carpentry-vel kötött együttműködésüknek köszönhetően egyre több kutató tanulhatja meg, miképp lehet spagetti kód helyett rendes programokat írni.

softwarecarpentry.jpg

  • Center for Open Science

cos.jpg

A Center for Open Science ingyenes statisztikai konzultációt biztosít és több tudományterületen is reprodukciós programot indított. Az alapítvány fejleszti az Open Science Framework-öt, ami egy online, ingyenesen elérhető tudományos workflow és projekt menedzsment eszköz.

  • rOpenSci

ropensci_logo.png

A rOpenSci az R statisztikai programozási nyelvhez nyújt könyvtárakat melyek megkönnyítik a reprodukálható kutatást, a nyílt adatokhoz való hozzáférést, az kutatási adatok publikálását és vizualizációját.

  • Directory of Open Access Journals

directory_open_access_journal.jpg

A DOAJ egy egyszerű és könnyen használható keresőfelületet nyújt a legtöbb minőségi nyílt hozzáférésű szaklaphoz.

  • opendata.hu és CKAN

opendatalogo.jpg

A magyar opendata.hu célja, hogy kereshetővé tegye a magyar vonatkozású nyílt adatokat, beleértve ebbe a tudományos adatokat is. Az Open Knowledge Foundation által fejlesztett CKAN szoftver fut az oldalon, amit különféle kormányzati és civil szervezetek használnak adatok megosztására és elérhetővé tételére. Az oldalon lehetőség van az adatokat linkelni, vagy akár fel is tölteni.

Miért nem jó a régi bevált rendszer?

A tudomány szeretne meritokratikus lenni. De ha csak az fér hozzá a tudáshoz, akinek megfelelő az anyagi háttere, akkor félő, nem a legjobb, legokosabb emberek fognak tudásunk gyarapításán dolgozni. Egyre hosszabb időt kell tanulással tölteni ahhoz, hogy valaki a tudományos közösség tagjává válhasson, ami egyre drágább mulatság. A tudományos adatok és workflow-k megosztásával a legjobb eljárásokat ismerhetik meg a tanulók, nem kell adatokat gyűjteniük, vagy kis projektjeikkel beszállhatnak egy nagy kutatásba is.

 

Az ipar számára is egyre fontosabb a tudomány. Innováció csak a kutatói szféra és az ipar együttműködéséből születhet. Saját területünknél maradva, a nyílt forráskódú szoftverek nélkül rendkívül magas lenne belépési költsége egy-egy új cégnek. Nyílt adatok nélkül, mint pl. a UCI Machine Learning Repository, nem tudnánk kiértékelni az elkészült termékeinket, sőt gyakran tréning adatunk sem lenne.  Az olyan nyílt hozzáférésű szaklapok, mint a Journal of Machine Learning Research vagy a Computational Linguistics, a kis és közepes vállalkozásoknál dolgozók nem férnének hozzá a terület legújabb eredményeihez.

citizen-science-image.jpg

A tudomány egyre nagyobb szerepet játszik a kormányzati döntéshozatalban is. Miközben szakértők döntik el, milyen új gyógyszereket engedélyeznek, hol épüljön atomerőmű, vagy éppen a szegénység felszámolását célzó randomizált kontrollált vizsgálatokat végeznek kormányzati szervek, a laikusok  számára ezek egyre inkább érthetetlenek. A nyílt tudomány megteremti a társadalmi kontroll lehetőségét, az ismeretterjesztés alapja lehet és a különféle citizen science mozgalmak bevonhatják az érdeklődő laikusokat és hobbistákat a tudományos munkába.

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Nem elég okosnak látszani (?)

2015.01.21. 07:19 Szerző: zoltanvarju Címkék: mesterséges intelligencia Turing Turing-teszt Turing-gép ELIZA

Alig pár hónapja ment át egy program a Turing-teszten, a mesterséges intelligencia kutatói már azon agyalnak, miként lehetne életszerűbbé tenni ezen teszteket. Habár a Turing-teszten jól szereplő programok (mint látni fogjuk) "tudása" nem éppen hatalmas, valahogy intuitíven jónak érezzük Turing alapötletét;  egy intelligens ágens képes társalogni, kérdésekre válaszolni csak úgy mint a Jeopardy-t 2011-ben megnyerő Watson.

 Kacsák és tesztek

Turing tesztjének több változata van, az alap helyzet háromszereplős imitációs játék. Ebben egy kérdező egy géppel és egy emberrel beszélget s a társalgás végén meg kell mondania melyik partnere humán. A gép akkor nyer, ha rá esik a kérdező választása.

turing_test_version_3.png

A bonyolultabb verzió szerint több kérdező vesz részt a játékban és akkor tekinthető intelligensnek a gép, ha a vizsgálatot végző személyek jelentős hányadát győzi meg arról, hogy "ő" ember.

turing_duck_test.gif

A Turing-teszt tkp. egy ún. duck test, hiszen annyit mond; ami úgy viselkedik mint egy ember, az intelligens és fordítva, ami intelligens, az úgy viselkedik mint egy ember.

Dennett szerint teljesen racionális, ha vélekedéseket, vágyakat, stb. tulajdonítunk valaminek, ami kellően komplex módon viselkedik. Ez nem jelenti azt, hogy ténylegesen intencionális, értelmes rendszerrel állunk szemben ilyenkor. Searle Az eleme, az agy és a programok világa című esszéjében a mesterséges intelligencia erős programjának nevezi azt az elképzelést, mely szerint egy megfelelően programozott számítógépre tekinthetünk úgy, mint egy elmére. Ez azzal jár, hogy elfogadjuk az agy és az elme kettősségét, hiszen a programok függetlenek az őket futtató gépektől. Searle szerint azonban az ilyen elme nem rendelkezhet intencionalitással, hiszen szimplán szimbólumokat manipulál. Hiába tűnik úgy, hogy intencionális a rendszer, ez csak a programozóinak köszönhető. Erről szól az előző posztunkban ismertetett kínai szoba gondolatkísérlet. De miről is szól Turing tesztje? Mit tesztel és miért? Hogyan lehet átmenni ezen a teszten, anélkül, hogy az intelligencia legkisebb jelét is mutassuk?

Mond gyorsan hogy Entscheidungsproblem!

colossus.jpg

Mindenki tudja, hogy Turingnak volt egy képzeletbeli gépe, a Turing-gép. Azután lett több nagyon konkrét gépe, melyekkel sikeresen törték fel Bletchley Parkban a német Enigma kódokat. Azt már kevesebben tudják, hogy Turing gépe a 19. század végén kezdődő matematikai és logikai válság lezárásának csodálatos pontja. A matematika megalapozásának programja a 19. században kezdődött, ennek terméke Frege munkássága, ami megalapozta a modern logikát (s egyben a számítástudományt). Sajnos Frege teljesen lemaradt arról, hogy learathassa a babérokat, mivel nagy összegző művében, Az aritmetika alaptörvényeiben Russel ellentmondást fedezett fel (Russel erről szóló levelét mellékletként leközölte Frege!) Innét elindult a hajsza a matematika megalapozása után. 1928-ban Hilbert fogalmazta meg, milyen követelményeket kell kielégítenie a szilárd alapoknak, ez a híres Entscheidungsproblem, vagy eldöntésprobléma. Ez tkp. azt követeli meg, hogy egy rendes algoritmusunk legyen, ami minden jólformált kijelentésre képes megadni hogy helyes-e, vagy másképp fogalmazva, levezethető-e rendszerünk axiómáiból. Gödel tétlei (mert kettő van neki) bebizonyították egy konzisztens rendszerben vannak igaz, de nem bizonyítható állítások s az ilyen rendszerek konzisztenciája nem bizonyítható a rendszeren belül. Gödel eredményei alig három évvel Hilbert problémájának ismertetése után jelentek meg. Turing egy kicsit tovább várt, mivel őt az izgatta, hogy mi "kiszámítható", azaz mit lehet levezetni, már ha érdeklődésünket a levezethető, bizonyítható állításokra korlátozzuk. Ez tulajdonképpen a matematikai tevékenység formalizálása, ami a híres Church-Turing tézishez vezetett. A Turing-gép nem más, mint annak formalizált leírása, hogy mit lehet bizonyítani, ezért lett az ezt bemutató tanulmány címe On Computable Numbers,  with an Application to the Entscheidungsproblem. A Breaking the Code-ban a zseniális Derek Jacobi pár szóban így foglalja össze, mit is jelentett ez a kis dolgozat.

 

Gondolkodás, nyelv, más elmék

Turing, Church és Gödel tételei lényegében visszacsempészik a pszichologizmust a logikába. No nem abban az értelemben, hogy a modus ponens aktuális pszichikai állapotunk függvényében fog működni, hanem visszatért vele az intuíció. Wittgenstein előadásaira járva Turing elgondolkodhatott azon, hogy miért is kell formalizálni és stabilnak tudni a matematikai alapjait.

Wittgenstein:... Think of the case of the Liar. It is very queer in a way that this should have puzzled anyone — much more extraordinary than you might think... Because the thing works like this: if a man says 'I am lying' we say that it follows that he is not lying, from which it follows that he is lying and so on. Well, so what? You can go on like that until you are black in the face. Why not? It doesn't matter. ...it is just a useless language-game, and why should anyone be excited? 
Turing: What puzzles one is that one usually uses a contradiction as a criterion for having done something wrong. But in this case one cannot find anything done wrong. 
W: Yes — and more: nothing has been done wrong, ... where will the harm come? 
T: The real harm will not come in unless there is an application, in which a bridge may fall down or something of that sort. 
W: ... The question is: Why are people afraid of contradictions? It is easy to understand why they should be afraid of contradictions, etc., outside mathematics. The question is: Why should they be afraid of contradictions inside mathematics? Turing says, 'Because something may go wrong with the application.' But nothing need go wrong. And if something does go wrong — if the bridge breaks down — then your mistake was of the kind of using a wrong natural law. ... 

C. Diamond (ed.) Wittgenstein's Lectures on the Foundations of Mathematics

A fenti párbeszéd analógiája mondhatjuk, hogy akkor az ellentmondásmentesség egyben azt is jelenti, hogy működőképes is valami? Lehet olyan, hogy ellentmondásos, vagy eldönthetetlen és ennek ellenére működik valami? Elvileg igen, hiszen erről szólna (az eredeti kontextusától persze elszakítva) a Gödel-tétel. Ez lenne az intuíció, olyan igazságok megtalálása, melyek nem levezethetőek.

 logicomix.gif

Az intuíció itt nem valami misztikus dolog, hanem valami, ami a Turing-gép keretein kívül van. De honnét tudjuk akkor, hogy valami többre képes mint egy Turing-gép? Hogyan állíthatjuk valakiről, hogy hozzánk hasonló intuícióval rendelkezik? Ezt nevezik a filozófusok a más elmék (other minds) problémájának. Wittgenstein privát nyelv argumentuma szerint ahhoz hogy feltételezzünk más elméket, szükség van a nyelvre.

"Mi lenne, ha az emberek nem nyilvánítanák meg fájdalmaikat (nem nyögnének, nem fintorítanák el az arcukat stb.)? Akkor egy gyereknek nem lehetne a 'fogfájás' szó használatát megtanítani." - Nos, tegyük fel, hogy a gyermek egy zseni, és maga talál ki egy szót arra, amit érez! - Ekkor persze ezzel a szóval nem tudná megértetni magát. - Szóval ő érti a nevet, de senkinek nem tudja jelentését megmagyarázni? - De mit is jelent, hogy 'megnevezte a fájdalmát'? - Hogy csinálta, hogy megnevezte a fájdalmat? ! És, akármit is tett - mi vele a célja? - Amikor azt mondják: "Nevet adott annak, amit érzett", akkor elfelejtik, hogy a nyelvben már sok mindennek készen kell állnia ahhoz, hogy a puszta megnevezésnek értelme legyen. És ha arról beszélünk, hogy valaki a fájdalomnak nevet ad, akkor itt a "fájdalom" szó grammatikája az, ami elő van készítve; jelzi azt a posztot, ahová majd az új szó kerül.

Wittgenstein: Filozófiai vizsgálódások

Habár lehetséges, hogy valaminek nyelvi megnyilvánulások nélkül intelligenciát tulajdonítsunk, az intencionalitás, miképp a Wittgenstein idézet rávilágít, társas és nyelvi természetű.

ELIZA, a legjobb beszélgetőpartner

eliza1.gif

Joseph Weizenbaum ELIZA programja a Turing-tesztre készülő programok őse. Az ELIZA-t leíró klasszikus tanulmányából vett példa szerint kb. így néz ki egy beszélgetés vele (a nagybetűs mondatok a géptől származnak).

Men are all alike.

IN WHAT WAY?

They're always bugging us about something or other.

CAN YOU THINK OF A SPECIFIC EXAMPLE?

Well, my boyfriend made me come here.

YOUR BOYFRIEND MADE YOU COME HERE

He says I'm depressed much of the time.

I AM SORRY TO HEAR YOU ARE DEPRESSED

It's true. I am unhappy

DO YOU THINK COMING HERE WILL HELP YOU NOT TO BE UNHAPPY

I need some help, that much seems certain.

WHAT WOULD IT MEAN TO YOU IF YOU GOT SOME HELP

Perhaps I could learn to get along with my mother.

TELL ME MORE ABOUT YOUR FAMILY

My mother takes care of me.

WHO ELSE IN YOUR FAMILY TAKES CARE OF YOU

My father.

YOUR FATHER

You are like my father in some ways.

WHAT RESEMBLANCE DO YOU SEE

You are not very aggressive but I think you don't want me to notice that.

WHAT MAKES YOU THINK I AM NOT VERY AGGRESSIVE

You don't argue with me.

WHY DO YOU THINK I DON'T ARGUE WITH YOU

You are afraid of me.

DOES IT PLEASE YOU TO BELIEVE I AM AFRAID OF YOU

My father is afraid of everybody.

WHAT ELSE COMES TO YOUR MIND WHEN YOU THINK OF YOUR FATHER

Bullies.

DOES THAT HAVE ANYTHING TO DO WITH THE FACT THAT YOUR BOYFRIEND MADE YOU COME HERE

Persze egy idő után fárasztó tud lenni ELIZA és könnyen ki lehet ejteni a szerepéből, de nagyon sokáig el lehet vele játszani. "Tudása" és fantasztikus "együttérzése" ún mintaillesztő szabályoknak köszönhető, melyek az ún. rogeriánus pszichológia visszakérdező módszerét imitálják. Norvig Paradigms of Artificial Intelligence Programming c. könyvében egy ELIZA típusú programhoz a következő szabályokat adja meg.

Minden (((?* ?x) W (?* ?y)) egy helyettesítő szabályt ad meg, pl. a (((?* ?x) computer (?* ?y)) akkor lép életbe, ha a bemenet tartalmazza a 'computer' szót, ami aktiválja a 

(Do computers worry you?) (What do you think about machines?)
(Why do you mention computers?)

válaszok valamelyikét (pl. véletlenszerűen választva). Sokkal inkább tűnik ez trükknek, mint valódi intelligenciának!

 

Az ELIZA effect nevet kapta ezért az a jelenség, amikor gépeket emberi tulajdonsággal ruházunk fel pusztán viselkedésük alapján. Maga Weizenbaum is erre a jelenségre akarta felhívni a figyelmet programjával, ahogy tanulmányának bevezetőjében írja:

It is said that to explain is to explain away. This maxim is nowhere so well fulfilled as in the area of computer programming, especially in what is called heuristic programming and artificial intelligence. For in those realms machines are made to behave in wondrous ways, often sufficient to dazzle even the most experienced observer. But once a particular program is unmasked, once its inner workings are explained in language sufficiently plain to induice understanding, its magic crumbles away; it stands revealed as a mere collection of procedures, each quite comprehensible. The observer says to himself "I could have written that". With that thought he moves the program in question from the shelf marked "intelligent" to that reserved for curios, fit to be discussed only with people less enlightened that he. The object of this paper is to cause just such a reevaluation of the program about to be "explained". Few programs ever needed it more.
Akkor most mi van?

Annyi bizonyos, hogy a Turing a tesztet az intelligencia szükséges és elégséges feltételeinek tekintette, azaz ha valami intelligens, akkor átmegy a teszten, ha nem, akkor megbukik. Úgy tűnik, bővítenünk kell a feltételek körét!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Miért nem kell félni attól, hogy a mesterséges intelligencia átveszi felettünk a hatalmat?

2015.01.13. 11:21 Szerző: zoltanvarju Címkék: jövő mesterséges intelligencia elmefilozófia konnekcionizmus deep learning embodied cognition

A technika fejlődése megállíthatatlannak tűnik. Már akad olyan program, ami átment a Turing-teszten. Az Amazon raktáraiban már most robotok indítják útjára a legtöbb rendelést, a Google Brain projekt képes volt YouTube videók alapján képes volt "megtanulni" a macska azonosításához szükséges készségeket, a Microsoft sem maradt le, real-time szöveges és hang alapú gépi fordítást vezet be a Skype-on. Pár éve a Google vezető közgazdásza még a statisztikust nevezte a 21. század legszexibb foglalkozásának, de nem is olyan régen úgy döntött a keresőóriás, hogy az Automatic Statistician projekt támogatásával megpróbálja a jövőben gépekre váltani a szakembereket is. A gépek egyre intelligensebbek és már nem csak a képzetlen munkaerőt fenyegetik, de vajon képesek lesznek egyszer teljesen leváltani minket?

employee-of-the-month.jpg

 

 Mi az a tudatosság?

Mind a Google, mind pedig a Microsoft újdonságai az ún. deep learning módszert alkalmazzák. Ez nem más, mint a neurális hálók vagy konnekcionista modellek egy újabb, hatékonyabb megvalósítása. Az eljárás lényege abban rejlik, hogy előre megadott reprezentációk helyett a neuronokhoz hasonló kis egységek közötti kapcsolatok erősségét állítgatják a tanulási folyamat során. 

2000px-cartesian_theater_svg.png

Daniel Denett karteziánus színháznak nevezi a bevett agy-elme felosztást, mely szerint az agyi folyamatok szintje mellett van egy minőségileg más szint, ez az elme. Dennett szerint teljesen felesleges feltételeznünk valami mögöttest, az elme, vagy a tudatosság nem más, mint neuronjaink működésének mellékterméke. 

 

Ha a tudatossághoz nem kell feltételeznünk mögöttes szervezőelveket, akkor a neurális hálókban megjelenő aktivitási mintázatokra alapozott viselkedést is tekinthetjük tudatosnak. Nagyon csábító gondolat ez, hiszen leredukálhatjuk egy fizikai jelenségre (a neuronok aktivitási mintázataira) a gondolkodás világát, amit így akár emberi sejtek helyett szilíciumlapkákon is megvalósíthatunk. De mit tud egy ilyen rendszer? Milyen tudással rendelkezik?

 

Searle kínai szoba gondolatkísérlete egy ilyen tudatosan viselkedő gépet szimulál. Képzeljünk el egy embert, akit bezárnak egy szobába egy kínai "grammatikával", ami egy szabálykönyv arra vonatkozóan hogy adott jelekre milyen választ kell adni. A külvilággal az ajtó alatt ki-becsúsztatott kínai írásjeleket tartalmazó lapokkal kommunikálhat emberünk. Ha egy anyanyelvi beszélő elkezd társalogni emberünkkel, akkor minden kérdésére választ kap, mert egy nagyon jó szabálykönyvet adtunk  a szobában tartózkodó emberünknek. A külső megfigyelő számára a szoba intelligensen viselkedik. Sőt, a józan észnek engedelmeskedve kedves kínai kísérleti alanyunk fel fogja tételezni, hogy a szobában tartózkodik egy kínaiul beszélő ember! Habár a szoba úgy viselkedik mint egy értelmes ember, valahogy nem szeretnénk intelligensnek nevezni a benne megvalósuló szabálykövetést.

A gondolkodás testesült

A redukcionizmus hatására egyre inkább elvetik a kutatók az elme és az agy kettősségét. Ugyanakkor jelentős problémát okoz annak megválaszolása, hogyan tesz rendet az agy a rázúduló információk áradatában. Hogyan lehetséges, hogy vannak közös hiteink, meg tudjuk érteni egymást, az eget kéknek látjuk stb. A hagyományos válasz szerint az elme rendezőelvei, pl. a chomskyánus univerzális grammatika és egyéb "előrehuzalozott" készségek miatt van ez így. A gépi tanulásban az ún. felügyelt módszerekkel tkp. ezt az implicit tudást adjuk át a gépeknek, amikor ún. tréningkorpuszokban jelezzük nekik pl. hogy egy adott képen van egy macska, a másikon pedig egy kutya. A neurális modellek során így épülnek fel az előre adott aktivitási mintázatok a neuronok között, melyek később természetesen a további tapasztalatoknak megfelelően átírhatóak.

bj_pagebat.png

Persze tekinthetjük ezeket az előzetes tudásokat a karteziánus színház visszacsempészésének is, de manapság inkább azt mondjuk az evolúció, s azon keresztül véletlenek sorozata miatt alakultak ezek ki és nincs sok közük az eredetileg feltételezett elméhez. Sokkal érdekesebb kérdés az, hogy a felügyelt tanítás során tényleg át tudjuk-e adni ezt az implicit, előzetes ismeretet a gépeknek. Ha igen, akkor képesek vagyunk mesterséges agyakat előállítani és van mitől félnünk. Thomas Nagel híres What Is it Like to Be a Bat? esszéjében azonban arra hívja fel a figyelmet, hogy a mentális állapotok kontextusfüggőek. Nem tudhatjuk milyen lehet denevérnek lenni, mert nincs olyan jó fülünk, hogy hallásunkkal tájékozódjunk, nem úgy látjuk a világot ahogyan egy denevér látja, nem tudunk repülni, stb. stb. Készíthetünk egy denevér modellt, amit mi értünk, de ezzel csak magunk számára tettük elérhetővé a denevér lététet, továbbra sem tudjuk milyen is denevérnek lenni. Ez azért van, mert a denevérséghe,z s úgy általában a mentális állapotokhoz hozzá tartozik egy ún. kválé, azaz szubjektív minőség. De honnét jön ez a kválé?

 

A testesült gondolkodás (embodied cognition) adja erre a legfrappánsabb választ (rövid érvek amellett hogy többek vagyunk mint csupán az agyunk itt). A kválé eredete nem más, mint az, hogy agyunk egy testhez kapcsolódik. Testünk határozza meg, hogy milyen ingerek érhetik agyunkat és milyen válaszokat adhatunk ezen ingerekre. A karteziánus cogito ergo sum ebben az elméletben átfordul "cselekszem, tehát gondolkodom"-ba.

A testesült gondolkodás nem csak egy szép elmélet, gyakorlatban is használják!

Rolf Pfeifer kutatócsoportja a robotika terén hasznosítja a testesült gondolkodás eredményeit s robotjaik révén gazdagítják tudásunkat a területről. Az EUCOG program keretében is nagy hangsúlyt fektettek az irányzat megismertetésére. Ugyanakkor a legpraktikusabb kutatásokat a MODE program végzi, hiszen ők azt vizsgálják, hogy az új információ- és kommunikációs technológiák hogyan hatnak ránk. A számítógépek, a mobilok és a hordozható kütyük ugyanis egyfajta kiterjesztéseink, kezünk, szemünk, fülünk és kitudja milyen érzékszerveink meghosszabbításai. Ha hatékony kütyüket, szoftvereket akarunk használni, akkor nem mehetünk el ezen tények mellett.

 

Meg kell tanulnunk a gépekkel együtt dolgozni!

Ha félnünk kell valamitől, az az, hogy nem tudunk alkalmazkodni a gépek jelentette kihívásokhoz. Az ipari forradalom óta a technológia egyre gyorsabban fejlődik, s ezzel az emberek produktivitása is jelentősen megnőtt. Ellenben a nyolcvanas évek óta a növekvő produktivitást nem követik a bérek. Brynjolfsson és McAfee The Second Machine Age című könyvében megdöbbentő grafikont találunk erről.

productivity-vs-income-houseofdebtblog.png

Ez annak köszönhető, hogy már nem csak a kékgallérosok állásait veszélyezteti a technológia. De egyben azt is jelenti, hogy az új technológiák kitalálói és kezelői egyre hatékonyabbak is! Nem a gépek győzik le az embereket, hanem gépek és emberek teremtenek soha nem látott hatékonyságot! Brynolfsson kedvenc példája Kasparov sakkbajnoksága, minek keretében nem emberek és gépek csapnak össze, hanem vegyes, gépek és emberek alkotta csapatok. Az új technológiáknak hála amatőr sakkozók és számítógépeik sokkal hatékonyabban tudnak együttműködni mint a csak gépekből vagy profi nagymesterekből álló csapatok!

A kérdés az, hogy testesült gondolkodásunk kiterjesztése az új technológiák által hogyan fog megvalósulni. A kognitív tudomány a schumpeteriánus innováció segítségére lehet megtalálni azokat az új területeket, ahol egyre több ember produktivitása növelhető úgy, hogy annak anyagi gyümölcseit minél többen élvezhessék is. A gépek eszközök, a kérdés az, kinek a kezében vannak!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Ráfázhatsz a big data elemzésével!

2015.01.05. 14:19 Szerző: zoltanvarju Címkék: statisztika reflexivitás big data Google Precognox Google Flu

A big data korában egyre gyakrabban halljuk, az adatok majd mindent megoldanak. A Google a cambridge-i egyetemmel összefogva elindította az Automatic Statistician projektet, ami azt célozza, hogy a hihetetlen adatmennyiségeket automatikusan feldolgozva találhassunk összefüggéseket. Úgy tűnik semmi dolgunk nem maradt, a technológiai megoldások átveszik a tudományos kutatás szerepét is, Chris Anderson jóslata az elméletek végéről hamarosan igazzá fog válni. Tényleg automatizálható a tudományos munka? Van technológiai megoldás a tudomány és az ipar területén keletkező adatok egyszerű és olcsó elemzésére? Gary King és társai  a Google FluTrends adatait vizsgálva arra hívják fel a big data híveinek figyelmét, hogy a szép új világ bizony nagyon messze van még és a technológiai szolucionizmus helyett a jó öreg viselkedés - és társadalomtudományok módszertanához kell fordulnunk. 

cell-phones-cancer.png

A Google Flu Trends a hype ellenére mellélő

A Google 2009-ben a Nature hasábjain megjelent tanulmányában mutatta be, hogy a keresési statisztikák influenza járvány előrejelzésében nagyon hasznosak lehetnek. A kutatás eredménye a Google Flu Trends , amely alapjaira épült a Google Correlate, a napjainkban divatos jelenbecslés (nowcasting) módszerek elindítója lett.

flutrends_hu.PNG

2014 legfontosabb tanulmánya a big data területén vitathatatlanul a Gary King és tsai nevéhez fűződő The Parable of Google Flu: Traps in Big Data Analysis. A rövid írás tkp. összefoglalható a benne közölt ábrával:

 img_1524.jpg

A fenti ábrán is láthatjuk, a Google Flu jelentősen túlbecsüli az influenza trendet, a hagyományos egészségügyi adatok sokkal jobbak (még akkor is, ha sokkal lassabb a beszerzésük). A legjobb azonban az, ha kombináljuk a keresési és a hagyományos adatokat! Hogy mi lehet ennek hátterében? A szerzők a big data felhasználásával kapcsolatban az alábbi problémákat említik:

  • A Google algoritmusai változnak, az hogy mi számít releváns keresésnek, változik időben
  • A találatok megjelenítése is változik, a Google egyre inkább elmozdul a question answering irányába, a betegségekkel kapcsolatos keresések, gyakran a Knowledge Graph által "kibányászott" tényeket tartalmazó dobozt adják első találatnak (l. a lentebbi képet).
  • További problémát jelent az, hogy az algoritmus változása hat a felhasználó viselkedésére. Ezt nevezik manapság a "name it they'll game it" elvnek.
  • Automatikusan szimpla korrelációkat keresni érdekes feladat, nagyon hasznos eredményeket is adhat ez, de nem lehetünk biztosak abban, hogy a feltárt összefüggés mögött oksági kapcsolat van s a jövőben is fent fog állni ez.
  • Először fordul elő a történelemben, hogy a privát szektorban több adat áll rendelkezésre mint a kormányzati és kutatóiban összesen. A privát szektor az adatokra mint erőforrásra tekint, nem áll érdekében (és gyakran jogilag sincs lehetősége) megosztani hogyan és milyen adatokat gyűjt.

google_answer08.PNG

Fontos megjegyezni, hogy King és tsai nem fikázzák le a Google Flu-t! Arra hívják fel a figyelmet, hogy annak alapvetően számítástudományi beállítottságú megalkotói elsiklottak metodológiai kérdések felett. Továbbá rávilágítanak arra, hogy a big data mellett az ún. small data és az adathalmazok összekapcsolása jelenti az igazán forradalmi lehetőséget.

Minden összefügg mindennel

 A keresők, de az egész internet világa alapvetően ember alkotta dolgok. Pontosan ezért alkalmasak, ha csak behatároltan is, a társadalmi jelenségek vizsgálatára. Azonban ha emberekkel van dolgunk, akkor egy különös világba csöppenünk, amit Soros reflexivitás fogalma jellemez a legjobban.

 

 

The concept of reflexivity needs a little more explication. It applies exclusively to situations that have thinking participants. The participants’ thinking serves two functions. One is to understand the world in which we live; I call this the cognitive function. The other is to change the situation to our advantage. I call this the participating or manipulative function. The two functions connect thinking and reality in opposite directions. In the cognitive function, reality is supposed to determine the participants’ views; the direction of causation is from the world to the mind. By contrast, in the manipulative function, the direction of causation is from the mind to the world, that is to say, the intentions of the participants have an effect on the world. When both functions operate at the same time they can interfere with each other.

How? By depriving each function of the independent variable that would be needed to determine the value of the dependent variable. Because, when the independent variable of one function is the dependent variable of the other, neither function has a genuinely independent variable. This means that the cognitive function can’t produce enough knowledge to serve as the basis of the participants’ decisions. Similarly, the manipulative function can have an effect on the outcome, but can’t determine it. In other words, the outcome is liable to diverge from the participants’ intentions. There is bound to be some slippage between intentions and actions and further slippage between actions and outcomes. As a result, there is an element of uncertainty both in our understanding of reality and in the actual course of events. (George Soros: The General Theory of Reflexivity)

Az internet világában folyamatos változásban vagyunk! Adatokat gyűjtünk, hogy jobbá tegyük meglévő rendszerünket. A megváltozott rendszer nyilván visszahat a felhasználókra is, ahogy Kingék is kimutatták a Google Flu esetében. A reflexivitás világában élünk! 

Mind társadalomtudósok vagyunk!

Justin Grimmer We're All Social Scientists Now: How Big Data, Machine Learning and Causal Inference Work Together című tanulmányában amellett érvel, hogy a a big data fantasztikus technikai lehetőségeket teremtette, de a technológiával elemezhető kérdések értelmes vizsgálatához a társadalomtudományok eszköztárára van szükség. Nem is annyira meglepő ez, hiszen az iparban általában felhasználókról és ügyfelekről, azaz emberekről szóló adatokkal foglalkozunk. Nem arról van szó, hogy ki kell rúgni minden programozót! Sokkal inkább arról, hogy a technológia nyújtotta lehetőségek kiaknázásához sokszínű csapatra van szükség. 

Hogy állunk ezzel mi?

precognoxlogo.png

King és társai tanulmányát olvasva alapvetően megnyugodtam. A Jobmonitor keresési adataira alapozott jelenbecsléses vizsgálataink során mi is a kevert modelleket (a hivatalos statisztikák, a GoogleTrends és a Jobmonitor logok adatainak mixelése ez esetünkben) találtuk a legjobbnak (erről a májusi meetupon számolt be kollégánk). De nem önmagában az eredmény nyugtatott meg, hanem az, hogy kis csapatunkban pont a megfelelő mixben vannak szakemberek. Egy IT cégnél nem meglepő, hogy vannak szép számmal programozóink, de az sem annyira egzotikus, hogy akadnak nálunk alkalmazott fizikusok. A kutatóink viszont legalább két területen vannak otthon a nyelvészet, filozófia (nem kell meglepődni, a logika nagyon jól jön a szemantikus technológiáknál!) a szociológia és a statisztika tudományaiban. Nem mellesleg kutató kollégáink az informatikában sem elveszettek!

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Miért foglalkozunk emócióelemzéssel és politikai blogokkal?

2015.01.02. 14:02 Szerző: zoltanvarju Címkék: nyelvészet politikai blogok Sandel kognitív nyelvészet Ekman emócióelemzés Lakoff kognitív torzulás Khaneman Nussbaum

Az utóbbi időkben a legtöbbször azt kérdezték tőlem, miért foglalkozunk olyan ezoterikus dolgokkal, mint az emócióelemzés és a politikai blogok világa. Egyáltalán, hogy jutott eszünkbe ez az téma? A rövid válaszom erre általában az, hogy szeretjük a szexi témákat és reméljük, valami hasznos (eladható) is kipottyanhat a projektből. A hosszú változat pedig ez a poszt. Három, elsőre nagyon különböző témát ismertetek röviden, melyek az emóciók és a politikai blogok vizsgálata felé tereltek minket. 

Hogyan kerültek előtérbe az érzelmek?

A tudomány alapvetően racionális, az érzelmekkel legfeljebb a pszichológia és a filozófia foglalkozott nagyon sokáig. A gazdasági válság hatására azonban nagyon megváltozott valami és hirtelen a közbeszédben is megjelent az eddig bevettnek hitt nézetek újragondolásának igénye. Michael Sandel Mi igazságos? című könyvében az AIG biztosító példáján keresztül szemlélteti, hogy az érzelmeknek milyen mély szerepe van mindennapjainkban. A 2008-as válságban megroggyant biztosítót a kormányzat több milliárd dollárral mentette meg, amit a vezetőség részben arra használt, hogy megjutalmazza magát. Az esetet "zsigeri felháborodás" követte, ami nagyon jól mutatja, hogy vannak olyan alapvető társadalmi kérdések, melyek nagyon mély érzelmeket váltanak ki az emberekből. Sandel mint politikafilozófus inkább azt elemzi, mi alakítja ki ezeket a közös elveket, miért nem szeretjük kimondani; igenis léteznek ezek és beszélnünk kell róluk, hiszen ez az a közös alap, amire a modern demokrácia épül.

Martha Nussbaum politikafilozófiájának középpontjába az emberi készségeket állítja, Amartya Sen közgazdász megközelítését továbbgondolva.

A Political Emotions-ban Nussbaum arra tesz igen meggyőző kísérletet, hogy a szeretet iránti igényből vezesse le a társadalmi összetartozást. Az egymás iránt érzett szeretet ebben a keretben nem csak a családi kapcsolatokat tartja össze, hanem ez alapozza meg az igazságosság alapelveinek elfogadását és a társadalom iránti elköteleződést.

Az érzelmek megférnek a racionalitással

George Lakoff gondolataival már sokszor foglalkoztunk blogunkon, most csak röviden összefoglaljuk, hogy mennyiben hatott ránk. Lakoff szerint fogalmi gondolkodásunk metaforákban zajlik, ezek pedig ún. keretekbe (frame) rendeződnek. Ezek a keretek teremtenek analógiás kapcsolatot az elvont és konkrét dolgok között (pl. a fent a jó, a lent a rossz stb.) Az hogy ilyen analógiákat észlelünk embervoltunk terméke. Ez kicsit fából vaskarika érvnek hangzik, de Lakoff az ún. embodid (testesült) gondolkodás híve, mely szerint az elme nem választható attól az anyagtól, amiben megvalósul, esetünkben az emberi testtől. Ebben az elméletben az érzelmeknek is megvan a maguk szerepe, hiszen nem választhatóak el a testesült gondolkodástól - magyarán a gondolkodással járnak - s szerencsénkre megjelennek a nyelvben is.

Paul Ekman az érzelemkutatás megalapítója a non-verbális megnyilatkozásokat vizsgálja főleg. Számunkra azért jelentős figura ő, mert elmélete szerint a hat alapvető érzelem univerzálé, azaz jelen van minden emberben, kultúrától függetlenül. A metaforák terén maximum relatív univerzálékról beszélhetünk, azaz a nyelvek többségében fellelhető jelenségekről, vagy bizonyos mintázatot mutató jelenségekről (pl. ha X jelenség jelen van egy adott nyelvben, akkor Z is, de ha N jelenik meg, akkor X nem) és nagyon bonyolult automatikus felismerésük. Ellenben az emóciók szótári alapon azonosíthatóak, igaz a sifterek és targetek problémáját nem tudjuk elkerülni esetükben sem. Külön érdekességként megemlítjük, hogy Ekman az utóbbi időkben az emóciók társadalmi vonatkozásai felé fordult.

Nem csak megfigyelhetünk, cselekedhetünk is

Akbas és társai a Pollyanna jelenséghez hasonló folyamatot figyeltek meg a pénzügyi híreket elemezve, melyet Mispricing Following Public News: Overreaction for Losers, Underreaction for Winners című tanulmányukban összegeztek. A vizsgálatok szerint a negatív szentimentre alapozott kereskedési stratégia sokkal jobban teljesít, mint a pozitív hírekre figyelő. A szerzők ezt egy ún. kognitív torzításnak (cognitive bias) tulajdonítják, ami összhangban van a Pollyanna jelenség vizsgálata során felhalmozott empirikus adatokkal.

 

A kognitív torzulások elmélete Kahneman és Tversky nevéhez köthető s egy manapság nagyon divatos tudományág, a viselkedésökonómia egyik alapkövévé vált. Mára már rengeteg kognitív torzulást katalogizáltak, ezek lényege, hogy egy "racionális vagy helyes" következtetés, vagy viselkedés helyett szisztematikusan tévesztünk bizonyos helyzetekben. Kérdés, hogy ha tudjuk hogy tévedünk, akkor beavatkozhatunk-e?

Sunstein és Thaler Nudge című könyvükben amellett érvel hogy igen, be kell avatkoznunk bizonyos helyzetekben. A könyv címe is utal arra, hogy noszogatnunk kell a helyes irányba az embereket, erre külön "mozgalom" is alakult és nudge theory néven emlegetik elméletüket. Ennek lényege, hogy ha ismerjük milyen helyzetekben hibázunk szisztematikusan, akkor alakítsuk úgy a körülményeket, hogy optimálisan döntsünk. (Pl. ha valaki opcionálisan köthet nyugdíjbiztosítást pár ezer forintért, vagy választhatja, hogy nagyobb fizetése legyen, akkor a jelen vágyai (no meg az adminisztrációs teher) felülírják a távoli jövővel kapcsolatos megfontolásait. A nudge theory hívei szerint legyen kötelező a biztosítás és az járjon adminisztrációs teherrel, ha valaki inkább magára költené azt a pár ezrest minden hónapban.)

 

Azzal, hogy befolyásoljuk döntéseinket, visszatértünk kiindulási pontunkhoz. Hogy merre tereljük az embereket, az egy értékítélet arról, mit gondolunk a jólétről, mit tartunk helyesnek és helytelennek, ez pedig visszavezet minket az érzelmekhez.

 

Hogy jön ez a mi projektjeinkhez?

OK, eddig a nyelvtechnológiáról egy szót se szóltunk, egyedül egy kis nyelvészetet érintettünk Lakoffon keresztül. Reméljük annyi már látszik, hogy a politikafilozófia inspirált minket és nyelvészeti, pszichológiai valamint társadalomtudományi irodalma van szépen a politikai viselkedésnek. A politikai blogok világa kínálja magát a megfigyelésre, hogy megnézzük milyen szerepet játszanak ezen a területen az emóciók, hogyan fejezik ki nyelvi viselkedésükkel a szereplők szándékaikat, hoznak döntéseket stb. A fenti forrásokból jött az inspiráció, de a mi megközelítésünk két, igen jelentős pontban eltér forrásainktól.

  1. A hálózatelemzés segítségével azt vizsgáljuk, mennyiben szolgálják az érzelmek ténylegesen a csoportok koordinálását. Hogyan terjednek az egyes emóciók, köthetők-e bizonyos témákhoz ezek?
  2. Az egyén vs. csoport vitával, azaz hogy alapvetően az individuum vagy a társas beágyazottság számít-e nem foglalkozunk, a hálózatelemzés megközelítése segít ezen túllépni és egy dinamikus rendszerben kezelni ezt a kettősséget.

A projekt során szerzett tapasztalataink reméljük átültethetőek más területekre is - akár az online marketing vagy éppen a pénzügyi hírelemzés és előrejelzés terén. 

A Kereső Világ a precognox_logo_190.jpg Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre