Ahogy ígértem is, elkészült David McCandles előadásának magyar felirata. Köszönöm Patai Annának a review-t.
Big Data - Keresés - Számítógépes nyelvészet - Szövegbányászat - Gépi tanulás - NLP Meetup - Precognox
Az adatvizualizáció szépsége
2010.09.10. 09:32 Szerző: ted vizualizáció
Címkék:A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Google angol ABC
2010.09.09. 10:50 Szerző: google
Címkék:Hogy látja ma a Google.com a világot, avagy a Google Instant az angol abc betűire:
A: Amazon, AOL, Att, Apple B: Best Buy, Bank of America, Bing, Bed Bath and Beyond C: Craigslist, CNN, Chase, Costco D: Dictionary, Droid X, Dominos, DMV E: eBay, ESPN, Expedia, Etsy F: Facebook, Facebook login, Firefox, Fandango G: Gmail, Google Maps, Google.com, Games H: Hotmail, Hulu, Home Depot, HP I: Ikea, IMDB, iPhone, iTunes J: Jet Blue, Java, Justin Bieber, JC Penney K: Kohls, Kmart, Kayak, Kroger L: Lowes, Lost, Limewire, Lyrics M: Mapquest, MySpace, MSN, Maps N: Netflix, Nordstrom, NBA, NOAA O: Orbitz, Office Depot, Old Navy, Overstock P: Pandora, Paypal, Pizza Hut, Petco Q: Quotes, QVC, Quicktime, Quiznos R: Rei, Realtor, Redbox, Runescape S: Sears, Skype, Sprint, Staples T: Target, Twitter, TMZ, Ticketmaster U: USPS, UPS, UTube, UFC V: Verizon, Verizon Wireless, VLC, VRBO W: Weather, Walmart, White Pages, Wikipedia X: Xbox, XM Radio, XKCD, Xbox Live Y: Yahoo, YouTube, Yahoo Mail, Yelp Z: Zillow, Zappos, Zip codes, Zumba Ha meglesz magyarul is a Google Instant, akkor a magyar ABC-t is érdekes lesz megnézni.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Hogyan tehetjük érthetőbbé az adatokat?
2010.09.08. 09:15 Szerző: keresés jövője ted vizualizáció
Címkék:Ma egyre kevésbé probléma a keresések során, hogy nem lenne elég találat. Sokkal inkább kérdés, hogy a megtalált adatokat hogyan tudjuk hatékonyan áttekinteni? Erre szerény kísérlet pl. az általunk a Johu keresőben is alkalmazott clustering (tartalomjegyzék) technológia. Ez a visszakapott találatok gyorsabb áttekinthetőségét segíti, akár grafikus formában is.
Általában is szükséges a nyers adatokat átdolgozva, csoportosítva összehasonlíthatóbbá tenni. Ezzel a kérdéskörrel foglalkozik a ma nagyon divatos adatvizualizáció. David McCandless: Az adatvizualizáció szépsége című angol nyelvű TED előadása (a magyar nyelvű fordításról hírt fogok adni, amint elérhető lesz) erre mutat remek példákat. Az általa készített vizualizációkat egyébként az előadás során talán többen felismeritek is majd, hiszen több közülük végigvonult a magyar megosztókon is.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
A képernyő jövője
2010.09.06. 10:00 Szerző: keresés jövője alternatív keresőfelület
Címkék:Az alábbi videó arra tesz kísérletet, hogy bemutassa milyen módon változtathatnák meg az életünket az új érintőképernyős technológiák.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.
Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre
Szöveg helyett hang?
2010.09.02. 10:35 Szerző: keresés jövője videokereső szöveges keresés
Címkék:A mai keresők egyik legfontosabb feladata a szöveges keresések, az írott természetes nyelvű lekérdezések megfelelő kezelése, megértése. Az automatikus helyesírás ellenőrzés, különböző szóalakok felismerése már teljesen természetessé vált az interneten való kereséseink során. Ezek a nagyon hasznos fejlesztések azonban a szöveges keresésre vonatkoznak. Felvetődik azonban a futurusztikus kérdés, hogy meddig fog még élni a szöveges tartalom?
A Berkeley egyetem egy kutatója fogalmazott meg néhány érdekes gondolatot ezzel kapcsolatban. Egyre több fajta tartalom megjelenítésére van lehetőség videó formájában, szinte bárki készíthet és feltölthet ilyeneket. Ráadásul ez gyakran már nem csak egyirányú kommunikációra korlátozódik, hiszen akár párbeszéd is kialakulhat ilyen módon, ha mindkét (vagy több) fél videó üzenetekben jelenik meg. A Youtube térhódítása egyértelmű, egyre népszerűbbé válik ott is a videó formájában való reagálás. Az is egyértelmű, hogy sokak számára a filmek már átvették a könyvek szerepét – természetesen ha csak lehet, felirat nélkül.
Számos előnye van a hangzó anyagoknak, gondoljunk csak a látássérült emberekre, vagy az olyan vidékeken élőkre, ahol az írás-olvasás készsége nem elterjedt dolog. Felvetődik a kérdés, hogy egyáltalán érdemes-e az ő tanításukkal foglalkozni, vagy inkább a technológia fejlesztésével minél több információt hang formájában elérhetővé tenni.
Nem elég azonban a hang és videó anyagok előállítása – bár a beszédtechnológia területén még van miben fejlődni ebből a szempontból is. A keresők viszont valódi lemaradásban vannak, hiszen nagyon kevés olyan lehetőség van, hogy nem szöveges tartalomban lehetne keresni, legyen az akár csak egyszerű kép. Bár vannak algoritmusok, amelyek többé-kevésbé próbálkoznak a feladat megoldásával (pl. Magyarországon a mindroom videós keresője), de talán még egyik sincs felkészülve arra, hogy alkalmas legyen egy átalakult tartalomhalmazban való keresésre.
Kétségtelen, hogy a digitális világból áradó adattömeg feldolgozásának gyorsabb módja lehet, ha kimarad az élő beszédnél sokkal lassabb írás és olvasás fázisa, de hogy valóban eljutunk-e idáig, az csak idővel derül ki.
A Kereső Világ a Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.