HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

HVG Jövő 2.0 - ajánljuk magunkat

2012.10.15. 07:00 Szerző: Zoltán Varjú Címkék: keresés keresés jövője HVG HVG Jövő 2.0

Megjelent a HVG Extra, Jövő 2.0 kiadványa, benne Jóföldi Endre és Varjú Zoltán (bizony, blogunk szerzői!) cikkével a 48. oldalon!

hvg-extra-jovo-2.png

Külön köszönet Molnár Tünde munkatársunknak aki ráncbaszedte mondatainkat és Marinov Ivánnak a HVG-től, aki elvégezte a végső simításokat. Egy kis ízelítő lent :-)

photo.jpg

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Palantir - az új generációs elemző intézet

2012.10.09. 12:00 Szerző: Zoltán Varjú Címkék: big data Palantir

Minden innováció egyben "kreatív rombolás", hiszen egy új technológia hatására általában sokkal hatékonyabban végezhető el egy adott feladat, a hatékonyság pedig gyakran egyet jelent azzal, hogy kevesebb ember is elvégezheti ugyanazt a munkát. Erik Brynjolfsson és Andrew McAfee Race Against The Machine című könyve remekül mutatja be, hogy a hagyományos fehérgalléros állások is veszélybe kerültek immár a big data előretörése miatt. A Palantir Technologies remek példa arra, hogy miképp alakul át a hagyományos "policy institute" adatvezérelt szervezetté.

Elég egy pillantást vetnünk a Palantir álláshirdetéseire és láthatjuk egyszerre keresnek elemzőket és fejlesztőket. A fejlesztői pozíciók azonban többségben vannak. A hagyományos elemző cégekhez hasonlóan több városban is jelen van a cég (az angolszász világot szépen lefedik már) elemző blogot is visznek, ugyanakkor van külön tech blogjuk is. Ez a furcsa kettősség annak köszönhető, hogy a Palantir egy adatvezérelt cég, célja nem a direkt elemzések készítése, hanem hogy elemzési infrastruktúrát építsen ki ügyfeleinek.

palantir02.png

A Palantir két API-t ajánl, Gotham és Metropolis, melyek lefedik az adatelemzés szokásos területeit az online adatok begyűjtésétől a statisztikai elemzésen át az adatvizualizációig. Alapesetben ezeket az API-kat használhatja a mezei ügyfél, de az igazán "nagy halak" azok, akikhez "be kell települni", azaz egy-két elemzőt és fejlesztőt kell kiküldeni szerződött partnerhez, hogy integrálják a Palantir technológiáját meglévő rendszereikhez és személyre szabhassák az elemzéseket.

palantir01.png

Hogy mennyire működőképes ez a modell az még a jövő kérdése. A Palantir ügyfelei között vannak kormányzati (állami és önkormányzati igazgatási, védelmi és egészségügyi intézmények) és üzleti szereplők is, továbbá ingyenesen (ill. nagyon kedvezményes áron) kínálják szolgáltatásaikat NGO-knak és a közösségi újságírásnak. A következő évek izgalmasnak ígérkeznek, hiszen várhatóan újabb szereplők jelennek meg a piacon és a hagyományos elemzőcégek is lépni fognak valamit.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Wajam és Gmail results - személyeskedjünk!

2012.10.02. 12:00 Szerző: Zoltán Varjú Címkék: keresés Google wajam gmail results perszonalizált keresés

A Eli Pariser által jegyzett iskola szerint a perszonalizáció árt a keresésnek, és valljuk be ebben lehet valami. A másik iskola szerint azonban egyre nagyobb teret nyer életünkben a digitális világ, valahogy kezelnünk kell ezt is. A Google egyértelműen a perszonalizáció útjára lépett, s ezt jobb ha kihasználjuk! A Wajam és a gmail results ebben remek segítséget nyújt nekünk, erről szól élménybeszámolóm.

gmail.png

A gmail results aktiválható (és később akár ki is kapcsolható) a Search Experiments oldalon. Engedélyezés után - amennyiben be vagyunk jelentkezve fiókunkba - a keresőmezőbe írt kifejezésekre postaládánkban is keresni kezd a Google, s az eredményeket a találati mező jobb oldalán, elkülönítve jeleníti meg.

A wajam egy böngésző plug-in telepítése után lehetőséget ad arra, hogy a különböző közösségi oldalakon (Facebook, Twitter, G+) is keressünk egy "hagyományos" Google keresés során.

wajaam02.png

A gmail results-hoz hasonlóan a találati lista bal oldalán jelennek meg a wajam eredményei. Elsőre talán kicsit túl komplikáltnak tűnhet ez a "mindent egyszerre, egy helyen" keresés, de hamar meg lehet szokni. Kifejezetten hasznos látni, hogy egy keresett kifejezés kapcsán milyen levelezést folytattunk és milyen vélemények jelentek meg a közösségi hálókon. A "filter bubble" jelenségét nem is tapasztaltuk, hiszen itt fordítva működik a dolog, nem bezár minket a közösség, hanem a plussz  találatok kiegészítik a személytelen keresési eredményeket. 

wajam04.png

Személyes példám talán jobban megvilágítja mire gondolok. Egy projekthez szükségem volt pár tanulmányra, melyeket sehogy se találtam meg a neten, áruk pedig túl borsos volt ahhoz, hogy a szokatlanul rövid absztraktok alapján fizessek értük. A keresés során egyszerre találtam rá pár blogra, mely lesújtó kritikát közölt a tanulmányokról, Twitter feedemben pedig egy vitára, melyből kiderült, hogy mégsem annyira rossz írások ezek, csak éppen szélsőséges reakciókat váltanak ki. Csodák csodájára gmail fiókomban volt két levél, amit egy barátommal váltottam még tavaly, s mindkettő arról szólt, hogy ő olvasta az inkriminált cikkeket, ezért rögtön írhattam is neki, hogy el tudja-e küldeni nekem az anyagokat. Az eset óta sikeresen találtam magamnak jó kávézót idegen városban, szlovák fordítót egy barátomnak és döntöttem el milyen képregényt olvassak hétvégén.

Természetesen mint minden eszköznek, a perszonalizált keresésnek is megvannak a maga korlátai. Híreket már csak elvből sem keresnék így, arra amúgy is ott van a Prismatic ami remekül kerüli ki a filter bubble-t. Tények keresésére, vagy a közösségi "zaj" kiszűrésére egyre többet kezdtem használni a Blekko keresőt, és hozzászoktam ahhoz, hogy bizonyos kontextusokban kilépjek Google fiókomból és úgy keressek.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Goldenblog 2012

2012.10.01. 08:09 Szerző: Zoltán Varjú Címkék: Goldenblog

Az idei Goldenblogon - immár második alkalommal - harmadik helyezést ért el a Kereső Világ. Büszkék vagyunk arra, hogy ilyen erős mezőnyben értük el a dobogó legalsó fokát:

goldenblog-2012.jpg

IT-blogok

1 IDDQD http://iddqd.blog.hu/
2 Plastik Média http://plastik.hu/
3 Kereső világ http://kereses.blog.hu/
4 Mindent mindenkinet http://mindenkinet.wordpress.com/
5 E-könyv olvasók http://ekonyvolvaso.blog.hu/
6 Fps blog http://blog.fps.hu/
7 Telefonközpont http://telefonkozpont.blog.hu/
8 Buherablog http://buhera.blog.hu/
9 Mutasd az asztalod

http://asztal.blog.hu/

10 Appleblog http://appleblog.blog.hu/

Rólunk írták:

Balogh Csaba (Tsabeeka) a Kereső világról:

"A Kereső világ már tavaly is dobogós volt, idén is az lett. Azt hiszem, ez elég jól jelzi, hogy a szerzők tudják tartani a színvonalat, folyamatosan érdekes írásokkal jelentkeznek az elsőre igen szűken szakmainak tűnő, de a posztjaik olvasgatása során mégis érthetően bemutatott területről."

A blog szeptemberben lett öt éves, a Goldenblog zsűri döntésénél szebb születésnapi ajándékot nem is kaphattunk volna.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Luminoso - a józan ész fényénél

2012.09.25. 12:00 Szerző: Zoltán Varjú Címkék: keresés common sense szemantikus keresés nyelvtechnológia Luminoso ConcepNet Marvin Minsky

A bluefin labs-hoz hasonlóan a Luminoso is az MIT Media Lab spin-off vállalkozása. A cég a Common Sense Computing Initiative kutatási program eredményeire építve kínál szövegbányászati és szemantikus keresési megoldásokat webes szolgáltatás keretében.

luminoso01.png

A Common Sense Initiative a mesterséges intelligencia egyik atyjának, Marvin Minsky-nek, az alapötletén alapul, mely szerint ahhoz, hogy igazán intelligens gépeket tudjunk alkotni, először létre kellene hozni az "általános emberi intelligencia" modelljét. Ezzel tkp. a felvilágosodás korától egyre intenzívebben vizsgált józan ész (angolul common sense) formális leírására törekedett a csoport. Minsky szerint a józan ész fogalma nem szorul különösebb magyarázatra Descartes leírása nyomán:

descartes.jpg

A józan ész az a dolog, amely a legjobban oszlik meg az emberek között, mert mindenki azt hiszi, hogy annyit kapott belőle, hogy még azok sem szoktak maguknak többet kívánni, mint amennyijük van, akiket minden más dologban csak igen nehéz kielégíteni. S nem valószínű, hogy ebben mindenki téved; ez inkább azt bizonyítja, hogy az a képesség, amelynél fogva helyesen ítélünk és az igazat megkülönböztetjük a hamistól - s tulajdonképpen ez az, amit józan értelemnek vagy észnek nevezünk -, természettől fogva egyenlő minden emberben, úgyhogy véleményeink nem azért különböznek, mert egyesek eszesebbek másoknál, hanem azért, mert gondolatainkat különböző utakon vezetjük, s nem ugyanazokat a dolgokat nézzük. (Descartes: Értekezés a módszerről)

A józan ész tehát egy olyan mindennapi tudás, melyet nem tudatosan birtoklunk, de életünk legtriviálisabb helyzeteiben is használjuk. Pl. amikor azt halljuk egy Thaiföldről hazaérkező barátunktól, hogy "Tegnap visszaváltottam a megmaradt kétezer bahtomat hét forintos árfolyamon." ki tudjuk találni, hogy a baht a thai fizetőeszköz neve. Vegyük észre, hogy a legtöbb felnőtt erre anélkül is képes lenne, hogy ismerné a kontextust, amiben elhangzott a mondat. A Common Sense Initiative keretében készített ConceptNet ilyen relációkat gyűjtött össze az évek során egy online felület segítségével. Habár a legtöbb relációt az angol nyelvű felületet használók adták meg, több más nyelven (köztük van a magyar is!) folyt az adatfelvétel.

A ConceptNet legújabb kiadása az összegyűjtött adatokat kiegészítette más szemantikus adatbázisokkal is. A CommonSense Initiative honlapján elérhető az adatbázis egy kellően nagy részhalmaza, ill. Amazon Web Services-en elérhető instance-hez is található link.

A Luminoso tkp. a ConceptNet adatbázisára épít. Egyrészt a cég adatbázisa sokkal nagyobb, mivel tartalmaz nem nyilvános adathalmazokat is. Másrészt a spin-offba került a know-how, a ConceptNet elkészítésében és használatában gyakorlott csapat átvitte magával tapasztalatát.

A Luminoso szolgáltatásai első látásra alapvetően nem különböznek más szövegbányászattal foglalkozó cégek termékeitől; keresést és klasszifikációt kínálnak és természetesen skálázhatóságot, hogy a big data se maradjon ki a listájukról. A mögöttes módszerük azonban teljesen egyedi és meglepően jól alkalmazható a gyakorlatban. A ConceptNet-re építve tkp. azt keresik meg, hogy a beindexelt szövegek hogyan illeszkednek a már meglévő fogalmi hálójukba. Így a szemantikus keresést gyorsan tudják megvalósítani, hiszen a gyakorlattal ellentétben nem először építenek egy területspecifikus ontológiát vagy szótárat, hanem egy előzetes hierarchiát illesztenek a meglévő szövegekhez. A klasszifikációt is hasonlóan oldják meg, aminek előnye, hogy a létrejött csoportok egyértelműen valamilyen jelentéssel bírnak. Még nem érhető el szolgáltatásként, de már dolgoznak a hasonló elveken működő sentiment analysis (érzelmi viszonyulás vagy polaritás mérése) rendszeren is.

A ConceptNet hatalmas sikert aratott szakmai körökben annak ellenére, hogy korántsem divatos elvek mentén alakították ki. A Luminoso remek példája annak, hogy érdemes odafigyelni a fősodoron kívüli eljárásokra és elméletekre is.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása