HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Felkapott témák keresése

2011.10.11. 12:00 Szerző: Zoltán Varjú Címkék: twitter alternatív tematikus kereső hírkeresés

A Twitter egyre több felhasználót hódít meg és egyre jobban integrálódik mindennapi médiafogyasztásunkba. Az arab tavasz során sok újságíró használta forrásként a csiripeket, de sok „mezei” internetező is egyfajta RSS olvasóként, híraggregátorként (is) használja immár a Twittert. Nem meglepő hogy megugrott a Twitter keresőjének forgalma, április óta több mint 33%-kal amivel immáron napi 800 millió keresés.

 

 

A Twitteren a felkapott témákat ”Trends” néven követhetjük a webes felületen, közvetlenül a csiripek mellett.

 

 

 

 

 

 

Az általános trendeken belül azonban immár a nyelvi azonosításnak és csiripek (önkéntes alapon) földrajzi információval való felturbosításának hála most már helyi/nyelvi terndeket is követhetünk.

 

 

 

  

Természetesen az hogy mi felkapott relatív, ha valakit pl. a nyílt adatok (open data) érdekel, és szeret részt venni a köré szerveződő közösségben, akkor közösség számára akadnak trendek. A legegyszerűbb eset amikor egy ún. hastagre (a csirip témáját megjelölő kulcsszó a # jellel prefixálva) keresünk rá.

 

 

Azok is elérhetik ezt a szolgáltatást akik nem rendelkeznek Twitter fiókkal a http://twitter.com/#!/search-home címen, egy tetszetős felületen keresztül (ám az eredmények a fentiekhez hasonlóan jelennek meg).

 

 

 

Mégis mire jó ez az egész? A Twitter nem csak egy a sok közösségi oldal közül, egyrészt aszimmetrikus (követünk fiókokat, akik nem kell hogy „visszakövessenek”, ill. akadnak akik követnek minket, de mi nem őket), másrészt erősen szelektív (magyarán nincs benne semmi kényszerítő erő, névtelenül is használható, egyedül preferenciáink határozzák meg kit követünk). A megosztott tartalmak természetesen csak linkeket jelentenek itt (140 karakterbe csak egy kis komment fér bele maximum), viszont a követőink által generált tartalmak kiadnak akár egy újságot is, erre jöttek rá a paper.li és TweetedTimes oldalak készítői. Egy fiók idősávja (a követett emberek csiripelései) és esetleg elmentett keresési kulcsszavak alapján dinamikusa. 

 

 

De itt is felmerül a kérdés hogy mennyire jó ha bezárkózunk a saját magunk prefernciáiba? Egyszerű a képlet, ha adott világnézettel és érdeklődési körrel választunk ki követendő fiókokat (és a közösségi média egyéb bugyraiban is az ezekhez passzoló barátokkal, ismerősökkel vesszük magunkat körbe) akkor van ami „nem jön át” a saját magunk gyártotta szűrőn. Cassan Sustein Republic.com 2.0 könyvében ennek veszélyire hívja fel a figyelmet:

 

„Internet enthusiasts really can't even see a problem and can't see the individual and social benefits of being exposed to stuff you didn't choose...I think it's a very firm part of human nature that if you surround yourself with like-minded people, you'll end up thinking more extreme versions of what you thought before.” [az internet kedvelői egyszerűen nem látnak egy problémát, nem látják be hogy milyen egyéni és társadalmi haszna van annak hogy ha olyan dolgokkal kerülünk szembe melyeket nem mi választunk.. Úgy gondolom hogy fontos alapja az emberi természetnek hogy ha magunkhoz hasonló emberekkel vesszük magunkat körbe akkor az extremitásokig megerősítjük saját gondolatainkat]

 

A idősávon alapuló tartalom generálásnak tehát megvannak a maga korlátai. Ezt felismerve több vállalkozás próbál túllépni a perszonalizáció problémáján (az anit-personalization buzzword alatt). A „legegyszerűbb” formája ennek a bit.ly (a Twitteren népszerű url-rövidítő megkönnyíti hogy beleférjen egy link és annak kommentje 140 karakterbe) a birtokába került hatalmas és folyamatosan bővülő linkek alapján indított NEWS.me néven hírszolgáltatást az iPad felhaszánlóit célozva meg. A Zite szintén az Apple táblagép birtoklóit csábítja hírolvasásra, különlegessége hogy egyszerre próbál meg áttörni a perszonalizáción és tanulni a felhasználó médiafogyasztási szokásaiból. Habár még nem indult el a Woven szolgáltatása, a gépi tanulás és számítógépes nyelvészet művelői nagyon várják, mivel remek szakemberek csillantottak meg nagyon igéretes képességeket hogy egyszerre kezeljék a két problémát.

 

Zite: Personalized Magazine for iPad from zite.com on Vimeo

A hírfolyam és annak feldolgozása, a preferenciák megjelenése a keresők fejlesztőit új kihívások elé állítják, az információk kezelése pedig egyre komplexebb feldolgozási módszereket követel meg, hiszen a hírek között meg kell tanulnunk eligazodni. Új, izgalmas feladatok előtt állunk.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr373263676

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása