Miért nem kell félni attól, hogy a mesterséges intelligencia átveszi felettünk a hatalmat?

2015.01.13. 11:21 Szerző: Zoltán Varjú Címkék: jövő mesterséges intelligencia elmefilozófia konnekcionizmus deep learning embodied cognition

A technika fejlődése megállíthatatlannak tűnik. Már akad olyan program, ami átment a Turing-teszten. Az Amazon raktáraiban már most robotok indítják útjára a legtöbb rendelést, a Google Brain projekt képes volt YouTube videók alapján "megtanulni" a macska azonosításához szükséges készségeket, a Microsoft sem maradt le, real-time szöveges és hang alapú gépi fordítást vezet be a Skype-on. Pár éve a Google vezető közgazdásza még a statisztikust nevezte a 21. század legszexibb foglalkozásának, de nem is olyan régen úgy döntött a keresőóriás, hogy az Automatic Statistician projekt támogatásával megpróbálja a jövőben gépekre váltani a szakembereket is. A gépek egyre intelligensebbek és már nem csak a képzetlen munkaerőt fenyegetik, de vajon képesek lesznek egyszer teljesen leváltani minket?

Mi az a tudatosság?

Mind a Google, mind pedig a Microsoft újdonságai az ún. deep learning módszert alkalmazzák. Ez nem más, mint a neurális hálók vagy konnekcionista modellek egy újabb, hatékonyabb megvalósítása. Az eljárás lényege abban rejlik, hogy előre megadott reprezentációk helyett a neuronokhoz hasonló kis egységek közötti kapcsolatok erősségét állítgatják a tanulási folyamat során.

Daniel Denett karteziánus színháznak nevezi a bevett agy-elme felosztást, mely szerint az agyi folyamatok szintje mellett van egy minőségileg más szint, ez az elme. Dennett szerint teljesen felesleges feltételeznünk valami mögöttest, az elme, vagy a tudatosság nem más, mint neuronjaink működésének mellékterméke.

Ha a tudatossághoz nem kell feltételeznünk mögöttes szervezőelveket, akkor a neurális hálókban megjelenő aktivitási mintázatokra alapozott viselkedést is tekinthetjük tudatosnak. Nagyon csábító gondolat ez, hiszen leredukálhatjuk egy fizikai jelenségre (a neuronok aktivitási mintázataira) a gondolkodás világát, amit így akár emberi sejtek helyett szilíciumlapkákon is megvalósíthatunk. De mit tud egy ilyen rendszer? Milyen tudással rendelkezik?

Searle kínai szoba gondolatkísérlete egy ilyen tudatosan viselkedő gépet szimulál. Képzeljünk el egy embert, akit bezárnak egy szobába egy kínai "grammatikával", ami egy szabálykönyv arra vonatkozóan hogy adott jelekre milyen választ kell adni. A külvilággal az ajtó alatt ki-becsúsztatott kínai írásjeleket tartalmazó lapokkal kommunikálhat emberünk. Ha egy anyanyelvi beszélő elkezd társalogni emberünkkel, akkor minden kérdésére választ kap, mert egy nagyon jó szabálykönyvet adtunk a szobában tartózkodó emberünknek. A külső megfigyelő számára a szoba intelligensen viselkedik. Sőt, a józan észnek engedelmeskedve kedves kínai kísérleti alanyunk fel fogja tételezni, hogy a szobában tartózkodik egy kínaiul beszélő ember! Habár a szoba úgy viselkedik mint egy értelmes ember, valahogy nem szeretnénk intelligensnek nevezni a benne megvalósuló szabálykövetést.

A gondolkodás testesült

A redukcionizmus hatására egyre inkább elvetik a kutatók az elme és az agy kettősségét. Ugyanakkor jelentős problémát okoz annak megválaszolása, hogyan tesz rendet az agy a rázúduló információk áradatában. Hogyan lehetséges, hogy vannak közös hiteink, meg tudjuk érteni egymást, az eget kéknek látjuk stb. A hagyományos válasz szerint az elme rendezőelvei, pl. a chomskyánus univerzális grammatika és egyéb "előrehuzalozott" készségek miatt van ez így. A gépi tanulásban az ún. felügyelt módszerekkel tkp. ezt az implicit tudást adjuk át a gépeknek, amikor ún. tréningkorpuszokban jelezzük nekik pl. hogy egy adott képen van egy macska, a másikon pedig egy kutya. A neurális modellek során így épülnek fel az előre adott aktivitási mintázatok a neuronok között, melyek később természetesen a további tapasztalatoknak megfelelően átírhatóak.

Persze tekinthetjük ezeket az előzetes tudásokat a karteziánus színház visszacsempészésének is, de manapság inkább azt mondjuk az evolúció, s azon keresztül véletlenek sorozata miatt alakultak ezek ki és nincs sok közük az eredetileg feltételezett elméhez. Sokkal érdekesebb kérdés az, hogy a felügyelt tanítás során tényleg át tudjuk-e adni ezt az implicit, előzetes ismeretet a gépeknek. Ha igen, akkor képesek vagyunk mesterséges agyakat előállítani és van mitől félnünk. Thomas Nagel híres What Is it Like to Be a Bat? esszéjében azonban arra hívja fel a figyelmet, hogy a mentális állapotok kontextusfüggőek. Nem tudhatjuk milyen lehet denevérnek lenni, mert nincs olyan jó fülünk, hogy hallásunkkal tájékozódjunk, nem úgy látjuk a világot ahogyan egy denevér látja, nem tudunk repülni, stb. stb. Készíthetünk egy denevér modellt, amit mi értünk, de ezzel csak magunk számára tettük elérhetővé a denevér lététet, továbbra sem tudjuk milyen is denevérnek lenni. Ez azért van, mert a denevérséghe,z s úgy általában a mentális állapotokhoz hozzá tartozik egy ún. kválé, azaz szubjektív minőség. De honnét jön ez a kválé?

A testesült gondolkodás (embodied cognition) adja erre a legfrappánsabb választ (rövid érvek amellett hogy többek vagyunk mint csupán az agyunk itt). A kválé eredete nem más, mint az, hogy agyunk egy testhez kapcsolódik. Testünk határozza meg, hogy milyen ingerek érhetik agyunkat és milyen válaszokat adhatunk ezen ingerekre. A karteziánus cogito ergo sum ebben az elméletben átfordul "cselekszem, tehát gondolkodom"-ba.

A testesült gondolkodás nem csak egy szép elmélet, gyakorlatban is használják!

Rolf Pfeifer kutatócsoportja a robotika terén hasznosítja a testesült gondolkodás eredményeit s robotjaik révén gazdagítják tudásunkat a területről. Az EUCOG program keretében is nagy hangsúlyt fektettek az irányzat megismertetésére. Ugyanakkor a legpraktikusabb kutatásokat a MODE program végzi, hiszen ők azt vizsgálják, hogy az új információ- és kommunikációs technológiák hogyan hatnak ránk. A számítógépek, a mobilok és a hordozható kütyük ugyanis egyfajta kiterjesztéseink, kezünk, szemünk, fülünk és kitudja milyen érzékszerveink meghosszabbításai. Ha hatékony kütyüket, szoftvereket akarunk használni, akkor nem mehetünk el ezen tények mellett.

Meg kell tanulnunk a gépekkel együtt dolgozni!

Ha félnünk kell valamitől, az az, hogy nem tudunk alkalmazkodni a gépek jelentette kihívásokhoz. Az ipari forradalom óta a technológia egyre gyorsabban fejlődik, s ezzel az emberek produktivitása is jelentősen megnőtt. Ellenben a nyolcvanas évek óta a növekvő produktivitást nem követik a bérek. Brynjolfsson és McAfee The Second Machine Age című könyvében megdöbbentő grafikont találunk erről.

Ez annak köszönhető, hogy már nem csak a kékgallérosok állásait veszélyezteti a technológia. De egyben azt is jelenti, hogy az új technológiák kitalálói és kezelői egyre hatékonyabbak is! Nem a gépek győzik le az embereket, hanem gépek és emberek teremtenek soha nem látott hatékonyságot! Brynolfsson kedvenc példája Kasparov sakkbajnoksága, minek keretében nem emberek és gépek csapnak össze, hanem vegyes, gépek és emberek alkotta csapatok. Az új technológiáknak hála amatőr sakkozók és számítógépeik sokkal hatékonyabban tudnak együttműködni mint a csak gépekből vagy profi nagymesterekből álló csapatok!

A kérdés az, hogy testesült gondolkodásunk kiterjesztése az új technológiák által hogyan fog megvalósulni. A kognitív tudomány a schumpeteriánus innováció segítségére lehet megtalálni azokat az új területeket, ahol egyre több ember produktivitása növelhető úgy, hogy annak anyagi gyümölcseit minél többen élvezhessék is. A gépek eszközök, a kérdés az, kinek a kezében vannak!

A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Facebook Tweet

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Ráfázhatsz a big data elemzésével!

2015.01.05. 14:19 Szerző: Zoltán Varjú Címkék: statisztika reflexivitás big data Google Precognox Google Flu

A big data korában egyre gyakrabban halljuk, az adatok majd mindent megoldanak. A Google a cambridge-i egyetemmel összefogva elindította az Automatic Statistician projektet, ami azt célozza, hogy a hihetetlen adatmennyiségeket automatikusan feldolgozva találhassunk összefüggéseket. Úgy tűnik semmi dolgunk nem maradt, a technológiai megoldások átveszik a tudományos kutatás szerepét is, Chris Anderson jóslata az elméletek végéről hamarosan igazzá fog válni. Tényleg automatizálható a tudományos munka? Van technológiai megoldás a tudomány és az ipar területén keletkező adatok egyszerű és olcsó elemzésére? Gary King és társai a Google FluTrends adatait vizsgálva arra hívják fel a big data híveinek figyelmét, hogy a szép új világ bizony nagyon messze van még és a technológiai szolucionizmus helyett a jó öreg viselkedés - és társadalomtudományok módszertanához kell fordulnunk.

A Google Flu Trends a hype ellenére mellélő

A Google 2009-ben a Nature hasábjain megjelent tanulmányában mutatta be, hogy a keresési statisztikák influenza járvány előrejelzésében nagyon hasznosak lehetnek. A kutatás eredménye a Google Flu Trends , amely alapjaira épült a Google Correlate, a napjainkban divatos jelenbecslés (nowcasting) módszerek elindítója lett.

2014 legfontosabb tanulmánya a big data területén vitathatatlanul a Gary King és tsai nevéhez fűződő The Parable of Google Flu: Traps in Big Data Analysis. A rövid írás tkp. összefoglalható a benne közölt ábrával:

A fenti ábrán is láthatjuk, a Google Flu jelentősen túlbecsüli az influenza trendet, a hagyományos egészségügyi adatok sokkal jobbak (még akkor is, ha sokkal lassabb a beszerzésük). A legjobb azonban az, ha kombináljuk a keresési és a hagyományos adatokat! Hogy mi lehet ennek hátterében? A szerzők a big data felhasználásával kapcsolatban az alábbi problémákat említik:

A Google algoritmusai változnak, az hogy mi számít releváns keresésnek, változik időben
A találatok megjelenítése is változik, a Google egyre inkább elmozdul a question answering irányába, a betegségekkel kapcsolatos keresések, gyakran a Knowledge Graph által "kibányászott" tényeket tartalmazó dobozt adják első találatnak (l. a lentebbi képet).
További problémát jelent az, hogy az algoritmus változása hat a felhasználó viselkedésére. Ezt nevezik manapság a "name it they'll game it" elvnek.
Automatikusan szimpla korrelációkat keresni érdekes feladat, nagyon hasznos eredményeket is adhat ez, de nem lehetünk biztosak abban, hogy a feltárt összefüggés mögött oksági kapcsolat van s a jövőben is fent fog állni ez.
Először fordul elő a történelemben, hogy a privát szektorban több adat áll rendelkezésre mint a kormányzati és kutatóiban összesen. A privát szektor az adatokra mint erőforrásra tekint, nem áll érdekében (és gyakran jogilag sincs lehetősége) megosztani hogyan és milyen adatokat gyűjt.

Fontos megjegyezni, hogy King és tsai nem fikázzák le a Google Flu-t! Arra hívják fel a figyelmet, hogy annak alapvetően számítástudományi beállítottságú megalkotói elsiklottak metodológiai kérdések felett. Továbbá rávilágítanak arra, hogy a big data mellett az ún. small data és az adathalmazok összekapcsolása jelenti az igazán forradalmi lehetőséget.

Minden összefügg mindennel

A keresők, de az egész internet világa alapvetően ember alkotta dolgok. Pontosan ezért alkalmasak, ha csak behatároltan is, a társadalmi jelenségek vizsgálatára. Azonban ha emberekkel van dolgunk, akkor egy különös világba csöppenünk, amit Soros reflexivitás fogalma jellemez a legjobban.

The concept of reflexivity needs a little more explication. It applies exclusively to situations that have thinking participants. The participants’ thinking serves two functions. One is to understand the world in which we live; I call this the cognitive function. The other is to change the situation to our advantage. I call this the participating or manipulative function. The two functions connect thinking and reality in opposite directions. In the cognitive function, reality is supposed to determine the participants’ views; the direction of causation is from the world to the mind. By contrast, in the manipulative function, the direction of causation is from the mind to the world, that is to say, the intentions of the participants have an effect on the world. When both functions operate at the same time they can interfere with each other.

How? By depriving each function of the independent variable that would be needed to determine the value of the dependent variable. Because, when the independent variable of one function is the dependent variable of the other, neither function has a genuinely independent variable. This means that the cognitive function can’t produce enough knowledge to serve as the basis of the participants’ decisions. Similarly, the manipulative function can have an effect on the outcome, but can’t determine it. In other words, the outcome is liable to diverge from the participants’ intentions. There is bound to be some slippage between intentions and actions and further slippage between actions and outcomes. As a result, there is an element of uncertainty both in our understanding of reality and in the actual course of events. (George Soros: The General Theory of Reflexivity)

Az internet világában folyamatos változásban vagyunk! Adatokat gyűjtünk, hogy jobbá tegyük meglévő rendszerünket. A megváltozott rendszer nyilván visszahat a felhasználókra is, ahogy Kingék is kimutatták a Google Flu esetében. A reflexivitás világában élünk!

Mind társadalomtudósok vagyunk!

Justin Grimmer We're All Social Scientists Now: How Big Data, Machine Learning and Causal Inference Work Together című tanulmányában amellett érvel, hogy a a big data fantasztikus technikai lehetőségeket teremtette, de a technológiával elemezhető kérdések értelmes vizsgálatához a társadalomtudományok eszköztárára van szükség. Nem is annyira meglepő ez, hiszen az iparban általában felhasználókról és ügyfelekről, azaz emberekről szóló adatokkal foglalkozunk. Nem arról van szó, hogy ki kell rúgni minden programozót! Sokkal inkább arról, hogy a technológia nyújtotta lehetőségek kiaknázásához sokszínű csapatra van szükség.

Hogy állunk ezzel mi?

King és társai tanulmányát olvasva alapvetően megnyugodtam. A Jobmonitor keresési adataira alapozott jelenbecsléses vizsgálataink során mi is a kevert modelleket (a hivatalos statisztikák, a GoogleTrends és a Jobmonitor logok adatainak mixelése ez esetünkben) találtuk a legjobbnak (erről a májusi meetupon számolt be kollégánk). De nem önmagában az eredmény nyugtatott meg, hanem az, hogy kis csapatunkban pont a megfelelő mixben vannak szakemberek. Egy IT cégnél nem meglepő, hogy vannak szép számmal programozóink, de az sem annyira egzotikus, hogy akadnak nálunk alkalmazott fizikusok. A kutatóink viszont legalább két területen vannak otthon a nyelvészet, filozófia (nem kell meglepődni, a logika nagyon jól jön a szemantikus technológiáknál!) a szociológia és a statisztika tudományaiban. Nem mellesleg kutató kollégáink az informatikában sem elveszettek!

A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Facebook Tweet

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Miért foglalkozunk emócióelemzéssel és politikai blogokkal?

2015.01.02. 14:02 Szerző: Zoltán Varjú Címkék: nyelvészet politikai blogok Sandel kognitív nyelvészet Ekman emócióelemzés Lakoff kognitív torzulás Khaneman Nussbaum

Az utóbbi időkben a legtöbbször azt kérdezték tőlem, miért foglalkozunk olyan ezoterikus dolgokkal, mint az emócióelemzés és a politikai blogok világa. Egyáltalán, hogy jutott eszünkbe ez az téma? A rövid válaszom erre általában az, hogy szeretjük a szexi témákat és reméljük, valami hasznos (eladható) is kipottyanhat a projektből. A hosszú változat pedig ez a poszt. Három, elsőre nagyon különböző témát ismertetek röviden, melyek az emóciók és a politikai blogok vizsgálata felé tereltek minket.

Hogyan kerültek előtérbe az érzelmek?

A tudomány alapvetően racionális, az érzelmekkel legfeljebb a pszichológia és a filozófia foglalkozott nagyon sokáig. A gazdasági válság hatására azonban nagyon megváltozott valami és hirtelen a közbeszédben is megjelent az eddig bevettnek hitt nézetek újragondolásának igénye. Michael Sandel Mi igazságos? című könyvében az AIG biztosító példáján keresztül szemlélteti, hogy az érzelmeknek milyen mély szerepe van mindennapjainkban. A 2008-as válságban megroggyant biztosítót a kormányzat több milliárd dollárral mentette meg, amit a vezetőség részben arra használt, hogy megjutalmazza magát. Az esetet "zsigeri felháborodás" követte, ami nagyon jól mutatja, hogy vannak olyan alapvető társadalmi kérdések, melyek nagyon mély érzelmeket váltanak ki az emberekből. Sandel mint politikafilozófus inkább azt elemzi, mi alakítja ki ezeket a közös elveket, miért nem szeretjük kimondani; igenis léteznek ezek és beszélnünk kell róluk, hiszen ez az a közös alap, amire a modern demokrácia épül.

Martha Nussbaum politikafilozófiájának középpontjába az emberi készségeket állítja, Amartya Sen közgazdász megközelítését továbbgondolva.

A Political Emotions-ban Nussbaum arra tesz igen meggyőző kísérletet, hogy a szeretet iránti igényből vezesse le a társadalmi összetartozást. Az egymás iránt érzett szeretet ebben a keretben nem csak a családi kapcsolatokat tartja össze, hanem ez alapozza meg az igazságosság alapelveinek elfogadását és a társadalom iránti elköteleződést.

Az érzelmek megférnek a racionalitással

George Lakoff gondolataival már sokszor foglalkoztunk blogunkon, most csak röviden összefoglaljuk, hogy mennyiben hatott ránk. Lakoff szerint fogalmi gondolkodásunk metaforákban zajlik, ezek pedig ún. keretekbe (frame) rendeződnek. Ezek a keretek teremtenek analógiás kapcsolatot az elvont és konkrét dolgok között (pl. a fent a jó, a lent a rossz stb.) Az hogy ilyen analógiákat észlelünk embervoltunk terméke. Ez kicsit fából vaskarika érvnek hangzik, de Lakoff az ún. embodid (testesült) gondolkodás híve, mely szerint az elme nem választható attól az anyagtól, amiben megvalósul, esetünkben az emberi testtől. Ebben az elméletben az érzelmeknek is megvan a maguk szerepe, hiszen nem választhatóak el a testesült gondolkodástól - magyarán a gondolkodással járnak - s szerencsénkre megjelennek a nyelvben is.

Paul Ekman az érzelemkutatás megalapítója a non-verbális megnyilatkozásokat vizsgálja főleg. Számunkra azért jelentős figura ő, mert elmélete szerint a hat alapvető érzelem univerzálé, azaz jelen van minden emberben, kultúrától függetlenül. A metaforák terén maximum relatív univerzálékról beszélhetünk, azaz a nyelvek többségében fellelhető jelenségekről, vagy bizonyos mintázatot mutató jelenségekről (pl. ha X jelenség jelen van egy adott nyelvben, akkor Z is, de ha N jelenik meg, akkor X nem) és nagyon bonyolult automatikus felismerésük. Ellenben az emóciók szótári alapon azonosíthatóak, igaz a sifterek és targetek problémáját nem tudjuk elkerülni esetükben sem. Külön érdekességként megemlítjük, hogy Ekman az utóbbi időkben az emóciók társadalmi vonatkozásai felé fordult.

Nem csak megfigyelhetünk, cselekedhetünk is

Akbas és társai a Pollyanna jelenséghez hasonló folyamatot figyeltek meg a pénzügyi híreket elemezve, melyet Mispricing Following Public News: Overreaction for Losers, Underreaction for Winners című tanulmányukban összegeztek. A vizsgálatok szerint a negatív szentimentre alapozott kereskedési stratégia sokkal jobban teljesít, mint a pozitív hírekre figyelő. A szerzők ezt egy ún. kognitív torzításnak (cognitive bias) tulajdonítják, ami összhangban van a Pollyanna jelenség vizsgálata során felhalmozott empirikus adatokkal.

A kognitív torzulások elmélete Kahneman és Tversky nevéhez köthető s egy manapság nagyon divatos tudományág, a viselkedésökonómia egyik alapkövévé vált. Mára már rengeteg kognitív torzulást katalogizáltak, ezek lényege, hogy egy "racionális vagy helyes" következtetés, vagy viselkedés helyett szisztematikusan tévesztünk bizonyos helyzetekben. Kérdés, hogy ha tudjuk hogy tévedünk, akkor beavatkozhatunk-e?

Sunstein és Thaler Nudge című könyvükben amellett érvel hogy igen, be kell avatkoznunk bizonyos helyzetekben. A könyv címe is utal arra, hogy noszogatnunk kell a helyes irányba az embereket, erre külön "mozgalom" is alakult és nudge theory néven emlegetik elméletüket. Ennek lényege, hogy ha ismerjük milyen helyzetekben hibázunk szisztematikusan, akkor alakítsuk úgy a körülményeket, hogy optimálisan döntsünk. (Pl. ha valaki opcionálisan köthet nyugdíjbiztosítást pár ezer forintért, vagy választhatja, hogy nagyobb fizetése legyen, akkor a jelen vágyai (no meg az adminisztrációs teher) felülírják a távoli jövővel kapcsolatos megfontolásait. A nudge theory hívei szerint legyen kötelező a biztosítás és az járjon adminisztrációs teherrel, ha valaki inkább magára költené azt a pár ezrest minden hónapban.)

Azzal, hogy befolyásoljuk döntéseinket, visszatértünk kiindulási pontunkhoz. Hogy merre tereljük az embereket, az egy értékítélet arról, mit gondolunk a jólétről, mit tartunk helyesnek és helytelennek, ez pedig visszavezet minket az érzelmekhez.

Hogy jön ez a mi projektjeinkhez?

OK, eddig a nyelvtechnológiáról egy szót se szóltunk, egyedül egy kis nyelvészetet érintettünk Lakoffon keresztül. Reméljük annyi már látszik, hogy a politikafilozófia inspirált minket és nyelvészeti, pszichológiai valamint társadalomtudományi irodalma van szépen a politikai viselkedésnek. A politikai blogok világa kínálja magát a megfigyelésre, hogy megnézzük milyen szerepet játszanak ezen a területen az emóciók, hogyan fejezik ki nyelvi viselkedésükkel a szereplők szándékaikat, hoznak döntéseket stb. A fenti forrásokból jött az inspiráció, de a mi megközelítésünk két, igen jelentős pontban eltér forrásainktól.

A hálózatelemzés segítségével azt vizsgáljuk, mennyiben szolgálják az érzelmek ténylegesen a csoportok koordinálását. Hogyan terjednek az egyes emóciók, köthetők-e bizonyos témákhoz ezek?
Az egyén vs. csoport vitával, azaz hogy alapvetően az individuum vagy a társas beágyazottság számít-e nem foglalkozunk, a hálózatelemzés megközelítése segít ezen túllépni és egy dinamikus rendszerben kezelni ezt a kettősséget.

A projekt során szerzett tapasztalataink reméljük átültethetőek más területekre is - akár az online marketing vagy éppen a pénzügyi hírelemzés és előrejelzés terén.

A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Facebook Tweet

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

John Batelle: Hogyan fog kinézni a keresés mobil eszközökön?

2014.12.26. 15:40 Szerző: Kereso75 Címkék: mobil keresés interfész felhasználói felület interface tervezés mobil keresés kontextus app kereső

Számos érdekes startup cégre bukkantam, miközben a mobil-világ megértésén tüsténkedtem. Az iram csak gyorsult, ahogy az alapítók elkezdték felfedni műhelytitkaikat. Ahogy az várható volt, rengeteg ember fáradozik érdekes dolgok létrehozásán - olyan szolgáltatásokon, melyek már eleve feltételezik, hogy a mobil-keresés fennálló rendszere nem fog sokáig állni. Lenyűgözőnek és további vizsgálatra alkalmasnak találom ezeket.

A legutóbbi a Jack Mobile, egy titokban feltörekvő startup, melyet a korábbi Facebook- és Apple-alkalmazott, Charles Jolley alapított Mike Hansonnal kb. egy éve, a Mozilla és a Cisco főmérnökével, aki korábban a Sherlock keresőalkalmazás 1.0-ás verzióját írta Apple-re.

Linkelnék valamit a Jack-ről, de egy oldalnyi általános információn kívül semmit nem lehet róla olvasni. Most, hogy Charles és Mike bevezettek a műhelytitkokba, lenyűgöző dolgokról tudok beszámolni, melyek rávilágítanak a poszt-webes világ keresési-, és az alkalmazások interfész-problémáira. Ha sikerül elrugaszkodni az asztali PC előtti üldögélés képétől, hogyan nézne ki a keresés? Mi a keresés maga, amikor az ember ezt a telefonján, az óráján, vagy bármilyen más, ráaggatott készüléken teszi?

A Jack megpróbál ezen kérdésekre válaszolni, és a csapat újragondolja az interfész alapvető felépítését is.

A keresés mobileszközökön eleve “génhibás”. A webes keresés alapvetései - melyektől működni tud az egész - egyszerűen hiányoznak a mobilokon. A telefonunkon nincsenek indexelhető linkek vagy nyilvánosan elérhető weboldalak gyűjteménye, melyeket szabadon lehetne analizálni vagy keresőrobottal követni. Csak izolált, a nagy levesben kavargó, egymástól független alkalmazások halmaza van, melynek elemei mind csak a saját funkciójuk betöltésére hivatottak. De ez nem jelenti azt, hogy ne lenne szükségünk keresésre a mobilokon, sőt, nagyon is sokat keresünk rajtuk. De a kapott eredmények nem valami felemelőek. Ez főleg azért lehet, mert a telefonunk a keresésre a webről szedi a választ. De ahogy arra Jolley és Hanson rámutatott, ezek a válaszok nem megfelelőek a mobil kontextusában.

Webes- kontra mobilkeresés

	Webes keresés	Mobilos (poszt webes) keresés
Kontextus	információ alapú	szükség alapú
Keresőkifejezés	Meghatározó (mi, ki, hol, miért)	Tett vezérelt (hogyan tudok, mit tudok, hol tudok, miért (nem) tudok)
Korpusz	Teljes (találd meg, amire szükségem van)	Javasló (Találj valami releváns információt)
Kulcsszignál	Link(ek)	Személyes háttér (kontextus)
Felhasználói felület	Parancsalapú	Társalgás jellegű
Személyre szabás	Keresési történet	App használat, helyszín, kontextus

A mobilkeresések egyszerűen mások

Kontextus: Amikor a telefonunkon keresünk (vagy bármilyen, helyhez nem kötött eszközön) nagy valószínűséggel teljesen más szituációban vagyunk, mint a “weben”. A mobilos keresések szolgáltatásokhoz kötődnek, pl. “Hogyan jutok el erre a címre?” és/vagy helyszínhez kötöttek, pl. “Milyen jó szállások vannak a közelben?”

Keresési kifejezés / Korpusz: A kontextus-különbözőség miatt a keresésünk tárgya rendkívül leszűkül. A mobilkereséseknek általában egy találata van. Nem egy linkhalmazt várunk, amit aztán átböngészhetünk, hanem a konkrét helyzetünkre vonatkozó választ szeretnénk. A mobilkeresések ezért inkább a szolgáltatások és a tettek felé mozdulnak el a keresési kifejezések oldaláról. Ez azt jelenti, hogy a keresés teljessége elé gördülő, vélelmezett akadály (az ár amit pl. a Google fizet a teljes Internet RAM-ban tárolásáért) mobilokon egyáltalán nem hátrány. Nincs szükségünk az összes, lehetséges, indexelt információra, csak az éppen megfelelőre. Hogy ez milyen információ? Ez a következő pontunk.

Szignál: Mobilon olyan új szignálok is rendelkezésre állnak, melyek extra információként szolgálhatnak (és kellene szolgálniuk) a relevánsabb keresési találatok érdekében (de nem teszik). Az egyik ilyen fő szignál az aktuális helyszín. Aztán ott van még a helyszíntörténet (merre jártunk korábban), a telefonra letöltött alkalmazások, azok használatának története és alkalmazási módja, ami rá is vezet következő pontunkra.

Felhasználói felület: A keresés mobilon jelenleg megegyezik webes társával. Parancssoros interfész, ahova begépelhetjük a kereső-kifejezésünket, amire kattintható linkeket kapunk válaszul. A Google keményen dolgozik ennek megreformálásán és általános keresőjének - ami képes előhozakodni az “egy igaz válasszal” - hang-alapú kereséssel való kombinálásával nagyot lépett előre. De a Jack-es srácok egy egészen másféle interfésszel hozakodtak elő, amelyet rendkívül izgalmasnak találok. Nevezzük a megközelítést “társalgásnak”.

A társalgási kereső-interfész

2004-ben találkoztam Gary Flake-kel, aki akkor az Overture - korának vezető kereső cége, amit a Yahoo később felvásárolt, ami ezáltal egészen a Microsoft általi bekebelezésig volt a Yahoo kereső “lelke”) - senior technikai vezetője volt. Már akkor is, amikor a mobilos keresés maximum csak hírből volt ismert, bosszantott a kereső-interfész.

Megkérdeztem, hogy miért nem tudunk előrébb lépni a keresésben, mivel a “tíz kék link” megközelítés olyan semmilyen volt. Fel akartam tenni egy kérdést, válaszokat kapni, majd új kérdést feltenni. Vagy még inkább: azt akartam, hogy a szolgáltatás tegyen fel nekem kérdéseket, pl. “A ‘jaguár’-ra kerestél. Az állatra, az autóra, a focicsapatra, vagy valami másra gondoltál?” Gary búslakodva rámnézett és olyasmit mondott, amit soha nem felejtek el: “Ha csak egy modális ablakom lehetne…”

Ezt arra értette, hogy akkoriban a keresés a tíz legjobb linkért való versengés volt, és bármi, ami ennek az útjába került - úgy mint egy felugró dialógus-ablak, amivel a keresést lehetett volna finomítani - visszatartó erejű volt az alkalmazás használatával szemben. És amennyivel kevesebben használják, annyival kevesebb a bevétel.

De az ötletet - az oda-vissza kérdezéses keresést, társalgást, ha úgy tetszik - nem tudtam kiverni a fejemből. Így talán elképzelhető meglepődésem, amikor Jolley és Hanson megmutatta a Jack Mobile kereső interfészének korai prototípusát, ami olyan volt, mint egy párbeszéd.

Megkértek, hogy ne áruljak el részleteket az interfészről, elég az hozzá, hogy egészen újszerű, és sokkal inkább oda-visszakérdezős, mint bármi más a weben jelenleg. Kellemes, és menő a használata. A Jack tudja hol vagyunk, így ha rákérdezünk arra, hogy “A Galaxis Őrzői”, megmutatja a vetítési időpontokat a közelünkben találatként. Ha arra kérdezünk, hogy “olasz éttermek”, nem egy listát ad Google+ értékelések alapján, hanem a közelünkben található éttermeket, esetlegesen értékelési sorrendben, amennyiben mondjuk GrubHub vagy OpenTable alkalmazás van a telefonunkon.

Tanulságok

A Jack még mindig nagyon korai stádiumban van, de alapítói számos kulcsfontosságú megállapítást tettek eddig is. Az egyik a teljességgel kapcsolatos. Míg a “hosszú farok” (ritkán előforduló keresések) esetek nagyon jelentősek a webes keresésekben, addig a mobilos keresés közvetlenül a lényegre koncentrál, ami azt jelenti, hogy szűkíthetjük indexelésünket és algoritmusainkat, úgy, hogy közben még mindig eredményre vezet a keresőkifejezések nagy része.

A mobilos keresés ugyanakkor nagyban személyre szabott. Nincs egy, általánosan megfelelő találati lista. Mobilon az alapján kell rangsort felállítani, ami a felhasználó számára leginkább célravezető, nem abból kell kiindulni, hogy valamely külső rangsoroló rendszer mit ítélt meg mérvadónak. A “3-as BMW” kifejezésre keresve más eredményt kell, hogy kidobjon a Mercedes szalon mellett, mint a főút menti gyorsétteremben. Noha a személyre szabott keresés a Google+ egyik legfőbb jellemvonása, az igazság az, hogy elég halovány a próbálkozásuk. A weben rettentően keveset tud rólunk a Google. Annál többet a telefonunk. Mindezen adat felszabadítása még mindig nagyon nehéz, de nincs már messze.

A Jack megközelítésének egyik legérdekesebb vonzata azonban az lehet, hogy hogyan kavarja fel az ökoszisztémát a “publikálók” és a “közönség” között. Hanson rámutat arra, hogy a webes keresés a fogyasztóról szól, a tartalom előállítója sokadrangú utas a történetben, nehéz helyzetbe hozva magát: állandóan tudatosítani, publikálni kell jelenlétét a weben, vagy elnyeli a jelentéktelenség mocsara. Mindenesetre teljesen az ismeretlen működésű varázsdoboz jóindulatára vagyunk bízva, amikor arról kezdünk agyalni, hogyan is találhatnak meg minket a weben. Hanson egészen másféle modellt vázol fel a Jack indexelési elvéhez. Olyat, melyben a publikálók app- és tartalmi struktúrájukat megadott query-típusokhoz címkézett, különbejáratú feedjeiken kézbesítik a Jack-nek. Ha ez úgy hangzik, mint a szemantikus keresés, nem véletlen. Hanson, aki a Mozillánál eltöltött ideje alatt a nyílt webes szabványok élharcosává nőtte ki magát, elárulta, mély sebeket hord a témával kapcsolatban. Ugyanakkor az az érzésük Jolley-val egyetemben, hogy egy újfajta játéktér jöhet létre, mely ténylegesen lehetővé teszi a szemantikus, személyre szabott keresést.

A Jack több kérdést vet fel mint amennyit megválaszol, de éppen ettől érdekes. Itt van egy kicsi, jól finanszírozott, kereső-, web-, és mobil-szakértőkből verbuvált csapat, akik ténylegesen új megközelítésből tekintenek egy problémára/lehetőségre. Erre mindenképpen oda kell figyelni 2015-ben.

A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Facebook Tweet

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Dec. 18. Évadzáró NLP meetup

2014.12.15. 07:25 Szerző: Zoltán Varjú Címkék: Neticle NLP meetup Precognox Kilgray

Évadzáró meetupunkat csütörtökön (december 18-án) tartjuk, a szokott helyen (Colabs-Buda) 18:00-tól. Érdemes eljönni, mert februárig kell várni a következőre! A részvétel továbbra is ingyenes, de arra kérünk mindenkit, hogy regisztráljon az esemény oldalán.

Az évad utolsó rendezvényén nyelvtechnológiai cégek mesélik el hogyan indultak, milyen nehézségekkel kellett szembenézniük és képet kaphatunk arról milyen is az az igazán nagybetűs élet ebben a világban. A bemutatkozók:

A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Facebook Tweet

HTML

Precognox

Precognox Blogkereső

opendata.hu

Facebook oldaldoboz

Blog figyelése (RSS)

Érdekes oldalak

Star Wars text mining

Főbb témák

Archívum

Belépés

A blog tartalmai CC licenc alá tartoznak

Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox

Miért nem kell félni attól, hogy a mesterséges intelligencia átveszi felettünk a hatalmat?

2015.01.13. 11:21 Szerző: Zoltán Varjú Címkék: jövő mesterséges intelligencia elmefilozófia konnekcionizmus deep learning embodied cognition

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Ráfázhatsz a big data elemzésével!

2015.01.05. 14:19 Szerző: Zoltán Varjú Címkék: statisztika reflexivitás big data Google Precognox Google Flu

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Miért foglalkozunk emócióelemzéssel és politikai blogokkal?

2015.01.02. 14:02 Szerző: Zoltán Varjú Címkék: nyelvészet politikai blogok Sandel kognitív nyelvészet Ekman emócióelemzés Lakoff kognitív torzulás Khaneman Nussbaum

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

John Batelle: Hogyan fog kinézni a keresés mobil eszközökön?

2014.12.26. 15:40 Szerző: Kereso75 Címkék: mobil keresés interfész felhasználói felület interface tervezés mobil keresés kontextus app kereső

Webes- kontra mobilkeresés

A mobilkeresések egyszerűen mások

A társalgási kereső-interfész

Tanulságok

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Dec. 18. Évadzáró NLP meetup

2014.12.15. 07:25 Szerző: Zoltán Varjú Címkék: Neticle NLP meetup Precognox Kilgray

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre