HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A kontextus órási ereje: keresés mobilon

2012.04.06. 12:08 Szerző: Kereso75 Címkék: mobil mobil keresés smartmobil

mobil_hol_keresel.jpgA keresés alapvető problémája és legrégibb kérdéseinek egyike, ami miatt a keresők nem tudnak máig sem jobb választ adni a kérdéseinkre, hogy nem ismerik a szándékunkat abban a pillanatban amikor a kérdésünket megfogalmazzuk. Az agyunk zárt rendszer a keresőrendszer számára ilyen szempontból, mondhatnánk még szerencse.

Ugyanazon keresési kifejezés más és más jelentést hordozhat a fejünkben. Nem írja le pontosan a keresőkifejezés azt, hogy mit szeretnénk. Például mit akarunk pontosan, amikor egy film címére, vagy egy író nevére keresünk?

Az ember és gép közötti kommunikációval foglalkozók válasza erre a problémára a kontextus. Mindent eszközt valamilyen kontextusban használunk. Minden esetben van egy gondolatunk, vagy mondjuk akaratnak, amivel egy célt szeretnénk elérni (szándék és cél).

Mobil: áttörés a keresésben

 

A mobil a keresés esetében pontosan a teljesebb kontextus miatt jelent nagyon fontos áttörést, és ad új lehetőségeket a kezünkbe. Tudhatjuk keresés közben a helyet, az időt, a korábbi helyszínt, kik mások vannak még ott, a használó mozgását, sebességét, vagy éppen milyen alkalmazást használt korábban. Mondhatnánk sokkal inkább belátunk a kereső agyába.

Ezért aztán érdekes feltételezéseket tehetünk. Ha egy étel nevére például a felhasználó otthon, a konyhájában keres, akkor feltételezhetjük hogy receptet keres. Ha viszont a belvárosban, és mondjuk ebédidőben keressük egy étel nevét, akkor nagyobb valószínűséggel egy éttermet keresünk. Egy film címe egy bevásárló központban, ahol mozi is található azt jelentheti, hogy kiváncsi vagyok mikor kezdődik a legközelebbi vetítése egy filmnek. Persze rögtön látjuk a korlátot is, mert lehet, hogy mondjuk DVD-n akarjuk megvásárolni a filmet.

A mobileszköz által nyújtott kontextus sem ad választ minden kérdésre a felhasználó szándékával kapcsolatban, de jó néhány kérdést és bizonytalanságot megválaszol illetve megszüntet.

Természetesen nem minden témában jellemző a mobilos keresés, de vannak olyan tématerületek, ahol már nagyon jelentős a mobilról keresők aránya. Ezek általában erősen lokálisak, tehát a korábban említett kontextusnak nagy szerepe van benne.

Hogyan lehet alkalmazni?

 

A mobilos keresésekben rengeteg lehetőség rejlik még! Érdemes olyan megoldásokat létehozni, amelyek figyelembe veszik a felhasználói kontextust. Két magyar példát hadd hozzak. Az egyik az árukeresés lehetősége. Biztosan nem csak én álltam már egy műszaki boltban egy termék előtt azon gondolkodva vajon a szuper akciós ár mennyire  valós vagy nem. Kapható-e ez most esetleg máshol olcsóbban? Ilyenkor sokat segíthet egy árösszehasonlító oldal, a példában az árukereső mobilos oldalát láthatjuk. Mindez sokkal jobb lehetne, ha a kontextust, vagyis a jelenlegi helyemet is figyelembe venné.

Másik példa a Pharmindex gyógyszer keresője, ahol rögtön arra is láthatunk példát, hogy milyen speciális keresési felülettel lehet alkalmazkodni egy terület igényeihez Itt például azt láthatjuk, hogy egy gyógyszer külső jellemző jegyei alapján akarjuk megtalálni, hogy mi is az, ha úgymond elgurult a gyógyszer. Persze azt nem tudom vállalnak e felelősséget, ha esetleg mégis rosszul azonosítottuk és vérnyomáscsökkentő helyett valami egészen mást veszünk be. Milyen jó lenne ha az orvostól kijövet a felírt gyógyszernek akarunk megbízható forrásból utánanézni, megtudva akár azt is, hol a legközelebbi patika ahol kapható és mennyiért vásárolhatjuk meg.

Mennyire fontos ez az egész?

 

A végére egy mellbevágó tény. Mennyire lényeges a keresés szempontjából a teljesebb kontextus? Nagyon. A AT&T és Nielsen felmérése alapján a mobilon helyi keresést végrehajtók 43 százaléka konkrétan el is ment a megkeresett üzletbe. 22%-uk pedig aztán vásárlást hajtott végre. Ez magasan kiemelkedő sikerességi, konverziós arány. A keresés témájától függetlenül, általánosságban is úgy látom, hogy a mobil területen pontosan azok a szolgáltatások tudnak kiemelkedően sikeresek lenni, amelyek a korábban említett kontextus jellemzőkre hangsúlyosan építenek.

Ennyire erős eszköz van a kezünkben. Használjuk ki!

Az előadás a 2012-es Smartmobil konferencián hangzott el. Az előadás diái:

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

10 tanács konferencia előadóknak

2012.03.30. 09:32 Szerző: Kereso75 Címkék: prezentáció előadás smartmobil

Jól éreztem magam a tegnapi Smartmobil konferencián, sok érdekes információt, előadást hallottam. Ugyanakkor nem mehetek el szó nélkül a magyar konferenciák állandó problémája, az idők nem betartása mellett. Előrebocsátom, magamat sem tartom kiemelkedő előadónak, mégis a problémát és az óriási csúszást érzékelve, az amúgy is 8 percre tervezett prezentációmat 5,5 percben mondtam el, kihagyva belőle néhány gondolatot.

Nem tartom tragédiának, hogy magyar előadók többségében nem tudunk olyan színvonalú előadást tartani még, mint mondjuk tegnap Robbie Douek (Google). Ő profi csapattal készül egy-egy ilyen prezentációra, és nyilván ezt az előadást is már többször elmondta különböző helyeken, aktualizálva a témáját. Viszont vannak olyan egyszerű alapelvek, melyek mindannyiunknak segítenek abban, hogy a magunk lehetőségei között fejlődjünk e tekintetben.

Hogyan tarthatsz jó konferencia előadást?

1. Tartsd be az időkeretet, amit kaptál. Ez az első, és legfontosabb. Miért baj, ha nem tartod be? Több fél felé is nagy hibát követsz el, ha nem így teszel.

Elsősorban tiszteletlenség a konferenciaszervezőkkel szemben. Ők megbíznának benned, hogy tudod mennyi időd van, és mi a teendőd. Ha nem tartod be, gyengíted a konferencia hatásosságát.

Tiszteletlenség a hallgatóság felé is, hiszen ők pontosan időre szeretnének bejönni egy-egy előadásra, és betervezik előre, hogyan váltanának a különböző termekben zajló programok között.

Tiszteletlenség a többi előadóval szemben, akik egy egyre frusztráltabb - vagy éppen elfogyó - közönség előtt kell elmondják mondandójukat. 

Végül, ha megadatik, hogy külföldre is eljuss prezentálni, nagy lesz az arcra esés. Sokkal drasztikusabban betartatják - éppen ezért az előadók egyébként maguktól be is tartják - az időkereteket. Számomra ez egy nem tolerálható bűn.

2. Ne mond el, hogy kevés az időd: Lehet, hogy tényleg kevés, de azzal, hogy ezt elmondod a kezdés előtt, csak rontani fogsz a helyzeteden. Vágj bele rögtön, ne szabadkozz! Ennyi időt kaptál, használd ki minél jobban. Ha te leszel Robbie Douek, majd te is kapsz 20 percet.

3. 10 perc, valójában nem 10 perc: Az elkerülhetetlen holtidőket - konferálás, mikrofon beállítás, prezentáció elindítása - leszámítva valójában maximum 8 perced van.

4. 10 perc, még csak nem is 8 perc: Egy két évvel ezelőtti 5(!) perces SeedCamp prezentációm óriási tanulsága ez. Legalább 10-szer gyakoroltam el szó szerint, a végletekig finomítva a prezentációt, kihúzva belőle a még kihúzható részeket, mire eljutottam az 5 perces hosszig. Élesben elmondva mégis kiderült, hogy még fél perc kellett volna... Valamiért élesben tovább fog tartani. Ezzel is kalkulálj!

5. Próbáld el! Sokakon láttam tegnap is a teljes és őszinte döbbenetet, hogy a 34 diából álló prezentációjuk nem fér el a rendelkezésre álló 8 perces időkeretben, és erre a 9. percben jönnek rá. Könyörgöm, próbáld el otthon, és mérd le! A mai okostelefonok, mint tegnap megtudtuk, sok mindenre, már erre is alkalmasak. A méltán zseniális előadónak tartott Steve Jobs nagyon sokszor elpróbálta és végig gyakorolta az előadásait, mielőtt azokat ténylegesen élesben elmondta.

6. Egy üzeneted legyen: Az időkeretbe nem fér bele, hogy egy témát teljes mértékben körül járj. Az előbbi pontban említett próba abban is segít, hogy kiválaszd mi lenne a fő üzenete az előadásodnak. Pollner ezt úgy fogalmazta meg a kommentjében, hogy legyen valami, amit hazavihetnek a hallgatóid.

Azért is, mert nincs információ tartalma a jól ismert általánosságoknak, ahogy ezt többen Twitteren is megjegyezték:

Annyira vicces hogy minden prezi azzal kezd hogy berobbant a mobil és mindenhol már mobilozunk. Tudjuk ezért vagyunk itt ;)


doktor_justice: Egyre erősebb az érzésem, hogy a mobilinternetes sztori nagy lesz Eddig minden előadó elmondta.#smartmobil

7. Power point diák: Ez az a terület, ahol szerintem már tisztán látszik a fejlődés az előző évekhez képest. Csak pár alapelv ismétlésképpen: 28 pontnál kisebb betűt ne használj. A legfontosabb üzenetek a dia tetején legyenek. Jó minőségű képeket keress. Ne legyenek hosszú, pontokba szedett listák egy-egy oldalon.

Nyilván lehet szempont az is, hogy a dia aztán az előadás meghallgatása nélkül is érhető legyen, ami ellentmond bizonyos esetekben az általános elveknek.

8. Ne legyenek felesleges körök: 10 perces időkeretben felesleges előre elmondanod a vázlatodat. Ez  valóban jó gyakorlat lehet egy fél órás előadás esetén, de egy 10 perces (tudod, valójában 8) konferencia prezentáció esetében, csak magadtól vettél el újabb 30 másodpercet. Feleslegesen.

9. Próbáld ki a diavetítésedet a helyszínen: Különösen igaz, ha nem a saját eszközödön lesz vetítve. Nem fog minden úgy működni, mint otthon. Tegnap is, nem egy ilyen eset történt.

10. Használj hagyományos eszközöket: Tudom, sokaknak az elevenébe vágok ezzel, mégis kimondom. Nagyon szexinek tűnhet iphoneról, ipadről vagy éppen Macbookról prezentálni, de tegnap is 50 százalék alatt volt a sikerességi arány. Természetesen egész más, ha az előadás előtt van 10 perced a beállításokra. Biztosan vannak olyanok is, akiknek érdekes a MacBook hozzáhangolása a kivetítőhöz, de ha 10 percem van, én nem vesztegetnék el 1 percet pont ezzel. Ha nem hiszed kérdezd meg Szabó Gergőt...

Szívesen olvasnám mások tanácsait is a témában, osszátok meg! Előre, a jobb konferencia előadásokért!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

32 komment • Kövess Facebookon • Iratkozz fel értesítőre

Linkeskedésből jeles: bitly

2012.03.27. 12:00 Szerző: Zoltán Varjú Címkék: twitter keresés jövője keresés problémái real time keresés bitly lokális keresés

A bitly (régebbi nevén bit.ly) sokak számára mint a Twitter url-rövidítője ismert. Az első adatvezérelt startupok egyike ma már egy hatalmas, folyamatosan bővülő adatbázison ül, ezt készül most bevetni a valósidejű (real-time) keresés terén.

A bitly nem csak egy cég a sok közül. Egyike az első igazán nagy adatokkal (big data) dolgozó startupoknak, mindehhez pedig egy kiválló kutató-fejlesztő csapatot alakítottak ki. Hilary Mason vezető fejlesztő neve fogalom az adattudománnyal (data science) foglalkozók körében (data diva - azaz adatdíva állandó jelzővel szokták illetni). Rajta keresztül a New Yorkban formálódó startup ökoszisztéma kiépítésében, valamint az adattudományi rendezvények (meetupok, Strata konferencia, stb.) szervezésében jeleskedik az url-rövidítő cég.

A bitly alapötlete egyszerű, a 140 karakteres csiripekbe nehéz volt anno linkeket is elhelyezni. A rövidítés mellett azonban elérhetővé tettek nagyon egyszerű, ám sokak számára fontos (vagy legalább érdekes) statisztikákat is, mint pl. hányan kattintottak a megosztott linkre, mely órákban, a világ mely tájáról, melyik oldalon stb. Nemrég ezt kiegészítették egy QR-kóddal is (quick respons code, azaz egy kis négyzet amiben a tévéken látható hangyaháborúhoz hasonló fekete fehér kockák találhatóak, ezeket a legtöbb okostelefon ma már képes felismerni ha a készülék kameráját ráirányítják, majd a beolvasás után a böngészőt elviszi az adott oldalra).

A bitlyenterprise a fent bemutatott szolgáltatás továbbfejlesztett változatát kínálja céges ügyfelek számára. Első sorban kiadók és a közösségi média elemzői veszik igénybe a többletszolgáltatást. A news.me közösségi médiából gyűjti össze ismerőseink megosztásai alapján a minket (feltételezhetően) érdeklő híreket. Habár nagyon érdekes kezdeményezés volt, hogy egy minimális összegért cserébe fizetős tartalmakat is beválogatott, az előfizetésből pedig visszaosztott szerződött partnereinek. Mára viszont ingyenes az alkalmazás és a perszonalizáció, valamint hírforrások figyelésének lehetősége került a fejlesztések középpontjába.

A valós időben történő keresés napjaink egyik legfelkapottabb témája. Még koránt sincs megoldva hogy pl. a legfrissebb, leginkább véleményformáló híreket egyszerűen, az időbeli változásokat figyelembe véve kereshessük. A bitly adatbázisa az ehhez szükséges információk tárháza hiszen egy helyen találhatók benne a megosztott linkek,  rákattintások, továbbosztások, időbeli változások, geolokációs adatok stb.

Nem csoda hogy a legújabb, még csupán "privát béta" módban működő bitly fejlesztés egy valósidejű kereső. A fenti videón maga Mason mutatja ezt be működés közben (0:32 körül keződik és kb 10 percig taglalja). Habár a valós idő földrajzi helyzettel párosítva nagyon hasznos lehet, sok esetben legalább annyi kérdést vet fel mint ahány problémát megold. Az idő és a hely relevanciájának kérdése kulcsfontosságú például, ha arra vagyunk kíváncsiak, mely tőlünk 20 percre lévő bárokban van éppen happy hours akció.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Google Knowledge Graph

2012.03.20. 12:00 Szerző: Zoltán Varjú Címkék: szemantikus web freebase metaweb linked data google knowledge graph

A Google Knowledge Graph-ról egyre több hír kerül napvilágra, nemrég a Mashable számolt be róla. Utánna jártunk mi van a háttérben és mit várhatunk ettől a technológiától.

A szemantikus web a kétezres évek elején még csak álom volt,  blogunkon is bemutatott linkelt adatok gyűjtése még nem indult el ekkor és még öt-hat évvel ezelőtt is sokan szkeptikusak voltak a program sikerét illetően. 2006-ban alapították meg lelkes szemantikus web szakemberek a Metaweb-et, ami azt a célt tűzte maga elé hogy szemantikus formában gyűjt adatokat (bármiről!) lelkes felhasználók segítségére támaszkodva. Ennek eredménye lett a Freebase adatbázis. Ez tkp. egy ún. entitás gráf, azaz az egyes elemek és a közöttük fenálló kapcsolatok egy gráf alapú reprezentációban tárolódnak a cég szerverein. Az elnevezés jelzi hogy nem teljesen klasszikus linkelt adatokról van szó, de a különbség a felhasználó szempontjából nüansznyi.

2010-ben a Google megvásárolta a Metawebet, de a Freebase továbbra is szabadon hozzáférhető maradt. Soka úgy gondolták hogy ezzel egyrészt fényezni akarja magát, mások szerint csupán acqui-hire azaz a tehetséges alkalmazottak átvétele állt. A Freebase használhatóságát a keresésben nagyon jól szemlélteti Freebase Parallax projekt:

Látható hogy sok esetben a Google vagy nem ad megfelelő választ keresésünkre, vagy pedig nagyon nehéz összeszedegetni az információmorzsákat a találatokból. Ezt gondolta tovább a Ubiquity + Freebase koncepciója, mely a Firefox-ot természetes nyelvi parancsok értelmezésével felruházó Ubiquity kiegészítőt köti össze a Freebase adatbázissal. Az eredmény pedig elképesztő:


Freebase + Ubiquity from spencer cooly on Vimeo.

A Knowledge Graph a Freebase-re építve, de immár automatikus módszereket és a neten fellelhető nyilvános és fizetős linkelt adatbázisokat is felhasználva elkezdett kiépíteni egy sokkal nagyobb és összetettebb gráf adatbázist. A fenti koncepciók már önmagukban is meggyőzőek, izgatottan várjuk mi jöhet még.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Adat piac 3. rész

2012.03.13. 12:00 Szerző: Zoltán Varjú Címkék: szemantikus web linked data kasabi adat piac

Sorozatunk korábbi részeiben olyan szolgáltatásokat mutattunk be, melyek nyers adatokat és az elemzésükhöz szükséges eszközöket kínálják, ill. rendezett formában egy API-n (application programming interface, alkalmazás programozási interfész) keresztül teszik elérhetővé a szükséges információt. Most a Kasabi szolgáltatását vesszük górcső alá.

A Kasabi mögött a szemantikus technológia egyik legismertebb és legerősebb cége a brit Talis áll. Az alapötlet nagyon egyszerű, a Factual mintájára begyűjtik az adatokat és egy API-n keresztül elérhetővé teszik. A hasonló filozófia mögött azonban két merőben eltérő technológiai megközelítés rejlik.

A Factual maga szedi össze a különböző adatokat és gondozza azokat (data curation). A Kasabi ellenben a DataMarket-hez hasonlóan kész adathalmazokat tárol saját szerverein. Ezek vagy ingyenesen elérhetőek vagy az adatokat létrehozó személyek és vállalatok töltik fel és bocsájtják áruba. Az igazi különbség abban rejlik, hogy a Kasabinak határozott elvárásai vannak az adatok formátumaira vonatkozóan.

Minden Kasabi adathalmaz egy ún linkelt adathalmaz melyben a linkek tkp. az egyes elemek közötti viszonyokat jelölik.  Ezeket RDF (Resource Description Framework) formátumban - egy a HTML-hez hasonló jelölőnyelv szabvány, melyben leírhatjuk a linkelt adatokat - tárolják a szerveren. Az RDF adatbázisok lekérdezését végző kereső nyelv (query language) a SPARQL (SPARQL Protocol and RDF Query Language) szabvány melynek több implementációja (megvalósítása) is létezik. SPARQL endpoint-nak (végpontnak) nevezzük az olyan nyilvános vagy zárt online szolgáltatásokat, melyek szabványos RDF alapú linked data adatbázisokat tesznek elérhetővé online. Minden Kasabi adathalmaz tkp. egy SPARQL endpoint.

Nem csodálkozunk ha az olvasó kicsit belefáradt az előző bekezdésbe. A linkelt adatok nagyon hasznosak, de használatuk korántsem triviális. Nagyon találónak tartjuk hogy a Kasabi logója egy szorgos kis méhecske, hiszen a linkelt adatok nem csak egy adahalmazon belül kapcsolódnak, hanem egymás között is tartalmazhatnak kapcsolatokat, egy helyen tárolva egyszerűen összekapcsolhatóakká válnak egy SPARQL lekéredezésen belül is.

Az elmúlt öt évben az adatvezérelt alkalmazások fejlesztői előtt tornyosult az adatok megszerzésének, kitisztításának és gondozásának problémája. A sorozatunkban bemutatott cégek szolgáltatásai jelentősen lecsökkentették a piacra lépés költségeit és reméljük már nem kell sokáig várni arra hogy egy vibráló startup ökoszisztéma alakuljon ki körülöttük.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása