HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Trapit - avagy megint egy közösségi hírolvasó

2012.05.08. 12:00 Szerző: Zoltán Varjú Címkék: közösségi média hírolvasó trapit

A trapit igen előkelő felmenőkkel büszkélkedhet, hiszen az SRI International kutatásaiból nőtt ki. Az SRI "alom" legismertebb tagja ma a Siri, az Apple személyi asszisztense, de sok érdekes egyéb SRI spin-off akad még.

 

A trapit is személyi asszisztens lenne, csak éppen a közösségi médiában és a hírfolyamokban szeretne segítségünkre lenni. Ennek megfelelően Facebook vagy Twitter fiókkal egyszerűen regisztrálhatunk a szolgáltatás eléréséhez.

 

Ha már bent vagyunk, akkor egy kellemesen egyszerű és áttekinthető felületen igazodhatunk el. Saját hírfolyamokat is beállíthatunk, személyre szabhatjuk a feedeket, de személyes tapasztalatom szerint egész jól kitalálja a felhasználó preferenciáit.

 

A "featured" listában különböző híreket (pl. szórakoztatás, tudomány, üzlet, sport stb.) böngészhetünk.

 

A minket érdeklő dolgokat olvasmánylisába is menthetjük.

Ez mind szép és jó, de valahogy nem érzem azt amit pl. a Prismatic esetében. Nem kapok újdonságokat, nem érzem hogy az RSS olvasóm helyett inkább ezt az eszközt akarom használni. Nagy előnye a design, ami a Wavii és a Prismatic esetében nem ment, az itt összejött remekül. Viszont itt is, ahogy a Wavii esetében gond van a háttérben futó algoritmusokkal! Nem elég nagy vonalakban belőni mi is érdekelheti a felhasználót, mert az nem eredményezi egyben azt, hogy ténylegesen ki is szolgálja a rendszer az érdeklődési körét. A filter bubble jelensége ma már közismert, aki ezen a téren labdába akar rúgni, annak meg kell oldani valahogy, hogy az olvasó saját véleményével ellentétes dolgokkal is szembesüljön. Reméljük a trapit fel fog nőni a feladathoz.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Adatújságírás 1

2012.05.01. 12:00 Szerző: Zoltán Varjú Címkék: média újságírás adatok adatújságírás

Nem tudunk úgy eltölteni egy napot olvasgatással, hogy ne fussunk bele egy aktuális siránkozásba arról, hogy haldoklik a print média, az online ingyenesség pedig az igénytelenség és a content farm-ok melegágya. Sajnos kevés szó esik arról (különösen hazánkban) hogy vannak akik nem sírnak, hanem cselekszenek és megpróbálják újragondolni az újságírást az internet és az adatok korában, ennek eredménye az adatújságírás.

Az adatújságírás egyik forrásának Adrian Holovaty (programozó/újságíró, a népszerű Django webprogramozási keretrendszer egyik megalkotója) A fundamental way newspaper site need to change esszéjét szokás tekinteni. Holovaty szerint ideje szakítani a „sztori centrikus”, azaz egy-egy történetet középpontba állító közlési formával mivel ez nem teszi lehetővé hogy a különböző platformokhoz tudjuk adaptálni a híreket. Egy hír magját a felhasznált adatok és azok alapvető elemzése alkotja, ezt a központi elemet tudjuk hordozni a print, mobil, webes és egyéb felületek között. Holovaty erről nem csak szépen tud írni, hanem Every Block oldalával elképzelését bizonyította is, ahol helyi híreket gyűjtenek csokorba az érdeklődők számára. Egy helyi hír általában nagyon helyhez kötött és a benne szereplő adatok is egy (viszonylag) szűk univerzumban értelmezhetőek, ez pedig egy számítógép számára nagyban megkönnyíti az automatikus feldolgozást. Azonban a lokális, adatcentrikus hírek csak egy kis szeletét teszik ki a hagyományos médiának is.

Manapság minden cég elkerülhetetlenül adatokat generál működése során, ezek feldolgozása az üzleti intelligencia területe. De van egy olyan terület ami szintén adatokkal dolgozik; az újságírás. A zsurnaliszták adatokkal dolgoznak (persze itt nem a bulvár médiára gondolok), alapesetben a gazdasági újságíró lételeme a gazdasági statisztika, de a sportújságíró sem lehet meg adatok nélkül, és hát egy riport is jó ha adatokkal van megtámogatva. Szerencsére a klasszikus újságírók nem azok a profithajhász, bezárkózó emberek és felismerték hogy a negyedik hatalmi ág is sokat tehet azzal a demokráciáért ha közzéteszi az általa összeszedett anyagokat. Ezt pedig a New York Times és a Guardian lapok profi módon tették meg. Nem csak egyszerűen letölthetővé tettek adatokat, hanem jól megtervezett API-kat hoztak létre erre.

A Guardian Datablog projektje a legjobb példa arra hogy nem kell programozónak válnia egy újságírónak ahhoz hogy adatokkal foglalkozzon. Minden cikk (vagy poszt?) alapja egy adathalmaz, ami külön le is tölthető. Az írások tulajdonképpen rövid elemzések, de nem mennek bele a technikai részletekbe. Az adatok "felmondását" elkerülik, inkább különféle (bárki számára elérhető) vizualizációs technikákat alkalmaznak hogy elmondják mi van az adatok mögött. Az embernek az a benyomása hogy ez egyrészt pofon egyszerű, de miért nem csinálják mások is ez? Miben különbözik ez a megközelítés a The Economist, vagy a HVG grafikáitól? Erre még nincs válasz. A Guardian nyomtatott verziójának olvasótábora rohmléptekben apad, az online változat olvasottsága nő és már többen Egyesült Királyságon kívül mint hazájában. Az online felület jövedelmezővététele kemény dió viszont ez az egyetlen járható út. A brit lapnál már elhatározták hogy a digitális verzió az irány adó (ez az ún. digital first irányelv) és keresik az új utakat..

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Wavii - közösségi hírfolyam

2012.04.24. 12:00 Szerző: Zoltán Varjú Címkék: adatok wavii adatújságírás

Korábban már bemutattuk a Wavii-t. Most, hogy már nem szupertitkos módon üzemel, egy kicsit közelebbről is megvizsgáljuk mit is tud.

A Wavii alapötlete egyszerű, hamár úgyis sokan a Facebook-on megosztott híreket olvassák, miért ne használjuk a közösségi hálót egy hírfolyam összeállítására. A lájkolások egész jól leírják egy felhasználó preferenciáit, ezek alpján lehet különböző érdeklődési köröket is felajánlani számára. Mivel egy rendes Facebook felhasználó amúgy is szeret lájkolgatni, a hírfolyamon is adjuk meg neki ezt a lehetőséget, így szépen magának taníthatja be a rendszert. Ez így leírva persze nagyon egyszerűnek és ötletesnek tűnik, de a képlet ennél sokkal bonyolultabb.

A választható témák oldalon elvileg olyan dolgok jelennek meg, melyek Facebook profilunk alapján érdekelhetnek minket. Azonban gyakran megesik hogy valahogy félresikerül ez az ajánlás, pl. gondolom Chris Jericho és a milanoi Scala azért került a nekem ajánlottak közé mert lájkoltam a Jericho tévésorozatot és a Scala programozási nyelvet. A frissítés ("Refresh") gombot nyomva új ajnlásokat kapunk, de ezek általában egyre távolabb állnak tényleges érdeklődéi körünktől.

Kapunk egy egyszerű és könnyen áttekinthető profilodalt is, sőt a Twitter-hez hasonlóan aszinkron (azaz itt nem a tényleges ismertség vagy barátság alapján választjuk ki kit követünk és ezt a viszonyt nem kell a követett személynek jóváhagynia, sőt nem kell visszakövetnie minket) követhetünk más felhasználókat. Hiába töltöttem hosszú perceket kétszer is azzal hogy kövessek embereket, ez nem jelent meg a profilomon. Lehet még nem működik ez a funkció élesben...

A hírfolyam spártai egyszerűsége nekem kifejezetten tetszik. Átláltható és egyszerű, az egyes hírekről csak a rövid leader, esetleg egy kép jelenik meg.

Több dolgot is tehetünk egy hírrel. Szerethetjük, utálhatjuk, elcsodálkozhatunk rajta. Ez talán túl sok. Annyi biztos hogy a rendszer tanul és egyre jobban kiszolgálja az ízlésünket ha szorgalmasan lájkoljuk vagy utáljuk a híreket. Ez viszont nem feltétlenül jó, hiszen így esélyünk se lesz valami érdekes újdonságot találnunk, vagy netalán nézeteinkkel ellentétes véleménnyel szembesülni. A filter bubble a Wavii esetében úgy gondolom valós veszély, ha valakit nem csak a saját kis világa érdekel, akkor válassza inkább a Prismatic-ot.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

DiscoverText, a szövegfelfedező

2012.04.17. 12:00 Szerző: Zoltán Varjú Címkék: analitika discovertext

A neten egyre több szöveges információ keletkezik. A közösségi média remek terepe lehet(ne) az egy-egy termékkel kapcsolatos információk és vélemények nyomonkövetésére. Ez a feladat azonban még várja, hogy valaki véglegesen megoldja, addig is a DiscoverText remek szolgálatot tehet nekünk.

 

 

A belépéshez LinkedIn vagy Facebook fiókra van csupán szükségünk s 14 napig ingyenesen kipróbálhatjuk mit tud a szolgáltatás.

 

 

Belépés után egy egyszerű, de könnyen kezelhető felület fogad minket.

 

 

Egy új projekt indítása után kiválaszthatjuk milyen forrásokból szeretnénk adatokat gyűjteni (Facebook, Twitter, LinkedIn, stb.) és megadhatjuk milyen időközönként milyen kulcsszavakra keressen helyettünk a DiscoverText, az eredményeket pedig el is menthetjük. Külön monitorozhatjuk a projektet is, ami különösen akkor fontos, amikor fizetünk is a szolgáltatásért.

 

Az adatokról nagyon alapos jelentést készít a rendszer, kezdve a geolokációs információktól a fontosabb közösségi média használók azonosításáig.

 

 

A begyűjtött adatokból pedig egy szófelhőt is generál nekünk az összefoglaló.

A DiscoverText egyszerű eszközt ad a kezünkbe, mely segíti bizonyos kulcsszavak nyomonkövetését a közösségi médiában. A sok hasonló szolgáltatásból az emeli ki, hogy az eddig inkább elméleti megközelítésnek tartott geometriai módszereket sikerült egy termékbe önteniük, kiváltva ezzel a szakma elismerését.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Hol történik ma az Internet és a mobil?

2012.04.10. 09:08 Szerző: Kereso75 Címkék: mobil statisztika

Rendszeresen rácsodálkozom, amikor előadók Magyarországon gondolkodás nélkül az amerikai adatok, statisztikák és kutatások alapján vonnak le következtetéseket az Internet vagy a mobil világ alakulásáról.

Vegyük észre, az Internet és a mobil egyre kevésbé ott történik.

Megjegyzés: a magyar adatokat csak azért vettem bele, hogy lásd mennyire érdemes egy szolgáltatást a magyar piacra célozni.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása