HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Adat piac 3. rész

2012.03.13. 12:00 Szerző: Zoltán Varjú Címkék: szemantikus web linked data kasabi adat piac

Sorozatunk korábbi részeiben olyan szolgáltatásokat mutattunk be, melyek nyers adatokat és az elemzésükhöz szükséges eszközöket kínálják, ill. rendezett formában egy API-n (application programming interface, alkalmazás programozási interfész) keresztül teszik elérhetővé a szükséges információt. Most a Kasabi szolgáltatását vesszük górcső alá.

A Kasabi mögött a szemantikus technológia egyik legismertebb és legerősebb cége a brit Talis áll. Az alapötlet nagyon egyszerű, a Factual mintájára begyűjtik az adatokat és egy API-n keresztül elérhetővé teszik. A hasonló filozófia mögött azonban két merőben eltérő technológiai megközelítés rejlik.

A Factual maga szedi össze a különböző adatokat és gondozza azokat (data curation). A Kasabi ellenben a DataMarket-hez hasonlóan kész adathalmazokat tárol saját szerverein. Ezek vagy ingyenesen elérhetőek vagy az adatokat létrehozó személyek és vállalatok töltik fel és bocsájtják áruba. Az igazi különbség abban rejlik, hogy a Kasabinak határozott elvárásai vannak az adatok formátumaira vonatkozóan.

Minden Kasabi adathalmaz egy ún linkelt adathalmaz melyben a linkek tkp. az egyes elemek közötti viszonyokat jelölik.  Ezeket RDF (Resource Description Framework) formátumban - egy a HTML-hez hasonló jelölőnyelv szabvány, melyben leírhatjuk a linkelt adatokat - tárolják a szerveren. Az RDF adatbázisok lekérdezését végző kereső nyelv (query language) a SPARQL (SPARQL Protocol and RDF Query Language) szabvány melynek több implementációja (megvalósítása) is létezik. SPARQL endpoint-nak (végpontnak) nevezzük az olyan nyilvános vagy zárt online szolgáltatásokat, melyek szabványos RDF alapú linked data adatbázisokat tesznek elérhetővé online. Minden Kasabi adathalmaz tkp. egy SPARQL endpoint.

Nem csodálkozunk ha az olvasó kicsit belefáradt az előző bekezdésbe. A linkelt adatok nagyon hasznosak, de használatuk korántsem triviális. Nagyon találónak tartjuk hogy a Kasabi logója egy szorgos kis méhecske, hiszen a linkelt adatok nem csak egy adahalmazon belül kapcsolódnak, hanem egymás között is tartalmazhatnak kapcsolatokat, egy helyen tárolva egyszerűen összekapcsolhatóakká válnak egy SPARQL lekéredezésen belül is.

Az elmúlt öt évben az adatvezérelt alkalmazások fejlesztői előtt tornyosult az adatok megszerzésének, kitisztításának és gondozásának problémája. A sorozatunkban bemutatott cégek szolgáltatásai jelentősen lecsökkentették a piacra lépés költségeit és reméljük már nem kell sokáig várni arra hogy egy vibráló startup ökoszisztéma alakuljon ki körülöttük.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr14292470

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

kirunews 2012.03.13. 16:41:41

Egy kis kiegészítés: a hagyományos API-kat a Kasabi megfejelte azzal, hogy felületet biztosít saját API létrehozsára. Ehhez alapvetően egy/több saját SPARQL lekérdezést kell megírni és valamennyire dokumentálni, amit mások már a lekérdezőnyelv ismerete nélkül is fognak tudni hazsnálni, pusztán felparaméterezve a lekérdezéseket (ugyanúgy, ahogy mondjuk a Flickr vagy Google APIt használjuk.) Továbbá: van Kasabi kliens könyvtár is (PHP-ra), ami további technikai rétegeket tud elrejteni.

Az Egyesült Királyságban tavaly óta több mashup versenyt is kiírtak, melyeknek a célja az adatok kreatív felhasználásának ösztönzése volt különféle területeken (kormányzati adatoktól a közgyűjteményi, bölcsész adatbázisokig). Több ilyen versenyben jutott fontos szerep a Kasabi már meglévő infrastruktúrájának.

Végül elhagyhatatlan, hogy a Kasabi nem pusztán egy platform, hanem igenis törekszenek az adatok felhasználásra. A blogjukban (blog.kasabi.com/) részletes esettanulmányok találhatóak, például arról, hogy mit és hogy lehet kihozni a new yorki menetrendekből. A fejlesztők pedig általában elérhetőek a #kasabi IRC csatornán is.
süti beállítások módosítása