HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A Kacsa

2012.02.14. 12:00 Szerző: kadar.akos Címkék: alternatív duckduckgo

A DuckDuckGo egy több szempontból is különleges keresőmotor: egyrészt már a neve is elég jó, másrészt egyetlen ember fejlesztette és indította útjára 2008-ban, aki nem más mint Gabriel Weinberg. A Search Engine Land cikke alapján bemutatjuk röviden a DuckDuckGo-t, majd a  http://donttrack.us/ és http://dontbubble.us/ oldalak , illetve Eli Pariser Ted előadásán keresztül ismertjük a Filter Bubble effektust. 

Weinberg alapötlete egy olyan keresőmotor volt, ami a Wikipedián és a Delicious adatbázisán keres, keresési eredményként felhasználva mindkét szolgáltató jó minőségű linkjeit. A DuckDuckGo saját kereső algoritmust használ, ami DuckDuckBot névre hallgat. Több, mint száz crowd-sourced oldal adataival dolgozik pl.: Yahoo! BOSS, WolframAlfa, EntireWeb, Bing stb. Így gyakorlatilag egy hibridmetakeresővel (hybrid metasearch engine) állunk szemben –hibrid, mert miközben számos adatforrást alkalmaz, egy utó feldolgozást is futtat. Így kiszűri a „haszontalan” oldalakat például, amiken nincs semmi csak reklámok stb. A többi metakeresővel szemben, nem csak a felhasznált oldalak eredményeit adja ki, hanem megpróbálja a források legjobb találatait kidobni. Mind emelett, Weinberg állítása szerint, jelenleg több, mint 70 millió oldal szerepel a DuckDuckGo spam list-jében.

Weinberg megszállottja a felhasználói adatok védelmének. Így nem meglepő, hogy több hatásos eszközt is beépített a motorba, melyek segítségével személyes keresésünk (illetve személyazonosságunk) anonim marad.

A kacsa 2008-ban indult útjára, de csak ez év elején kezdett igazán agresszív marketingbe Weinberg  és indította útjára  Google ellenes kampányát "Google tracks you. We don't."(A Google követ. Mi nem.) szlogennel. Szükséges ismertetnünk a továbbiakban a guglit, mint nagy testvért, illetve a Filter Bubble effektust, hogy rávilágítsunk mi ellen is harcol valójában a DuckDuckGo.

Nagy testvér

Ma már köztudott, hogy a Google és más keresőmotorok számtalan adatot tárolnak rólunk. Például ezen az oldalon http://donttrack.us/ véleményünk szerint nagyon egyszerűen és érthetően képet kaphatunk miről is van szó. Röviden:

  1. Beírjuk a gugliba, hogy herpesz.
  2. A gugli kiad egy csomó oldalt.
  3. Rákattintunk egy oldalra.
  4. Ekkor a keresőbe beírt szót, illetve a böngészőnkkel és számítógépünkkel kapcsolatos információkat elküldi a gugli az oldalnak, amire rákattintottunk.
  5. Így akár egyedileg is azonosíthat minket az oldal.
  6. Ezeken az oldalakon általában reklámoznak más oldalak is, és ezek profilt gyártanak rólunk.
  7. Ezért van az, hogy ha sokszor érdeklődünk herpesz kenőcsök után nem hagynak minket békén a herpesszel kapcsolatos gugli reklámok.

Úgy gondoljuk már ez is elegendő ahhoz, hogy jogosan le nagytestvérezze valaki a Google-t, de van egy másik jelenség, ami nem ilyen vicces és sokkal messzebbre vezet. Ez a jelenség a fentebb említett Filter Bubble. 

Filter Bubble

A "szűrőbuborék"-ról bővebb információkat kaphatunk a http://dontbubble.us/ oldalon, illetve Eli Pariser "Beaware online filter bubbles" c. előadásából. Az utóbbin végig megyünk vázlatosan, de mindenkinek ajánljuk, hogy nézze meg a videót:





















 

  1. Pariser első példája a Facebookról szól. Ő liberális politikai beállítottságú és egy idő után nem látta a konzervatív barátainak a posztjait. Ez azért történt mert többet kattintott a liberális barátai linkjeire, mint a konzervatívokéra.

  2. A második példája a Google-ról szól. Azt állítja, hogy ha adott időpillanatban többen rákeresnek egy adott szóra, nem feltétlenül ugyanazokat a találatokat adja mindenkinek a keresőmotor. Ennek hasonló az oka, mint a Facebooknál. A Google számtalan adatot dolgoz fel amikor keresünk pl. a számítógéppel kapcsolatban, a böngészővel kapcsolatban stb. Pariser a következő következtetést vonja le: "Nincs többé standard google". Ezt két barátján Scotton és Danielen keresztül mutatja be. Mindketten beírták a Google-be, hogy Egypt (Egyiptom). Danielnek az első oldalon egyetlen találata se jelent meg az egyiptomi tüntetésekkel kapcsolatban, ezzel szemben Scott szinte csak ilyen eredményeket kapott.

  3. Megemlíti, hogy a világ legnagyobb hírportáljai is dolgoznak a "personalisation", személyre szabás eszközével.

Mindennek a következménye a Filter Bubble. Maga a buborék az, amiben van a felhasználó. Nem lát ki, nem látja mit szűr meg az "internet". Csak azokat az információkat látjuk, amikre az algoritmusok szerint szükségünk van, amit az internet úgy gondol, hogy számunkra érdekes lehet. A probléma az, hogy nem tud a felhasználó dönteni arról, hogy mi kerüljön a buborékjába, az "internetes viselkedése/magatartása" fogja meghatározni.  Ezzel az a probléma, hogy az ember gyakrabban olvas baromságokról, mint analitikus filozófiáról.

Pariser a zöldség és édesség szembenállását hozza analógiaként. Kicsit átírom a metaforáját: Ha úgy működne a Tesco, mint a Google, akkor, ha én lépnék be a a szupermarket ajtaján gyakorlatilag csak sushi lenne a polcokon, és nem igazán jutnék gyümölcshöz. Az édesapámra szabott Tescoban pedig különböző fajta csokoládék lennének még a tejes pultokban is. Az én Tescom kicsit egészségesebb alternatíva, de nem kellene, hogy apám kisgyerekes ízlésére még a Tesco is rátegyen egy lapáttal. Nem jó, ha a Google dönti el mire van szükségünk, mert az ízlésünk nem biztos, hogy tükrözi valódi igényeinket. így értelmeztük Pariser álláspontját.

 

Vissza a Kacsához

A DuckDuckGo a fentebb említett „personalisation” eszközével nem él, tehát nem fogja édesség irányba eltolni a keresésünket, kapunk majd zöldséget is. Ezen felül több eszközt is használ a keresők személyiségi jogának megvédésére. Még a cikk elején említettük a „Google tracks you. We don’t.” szlogent. Ezalatt a herpeszes példában leírtakat kell érteni (a gugli használata során adatok kerülnek a keresőről a megkeresett oldalakhoz). A két legfontosabb törekvése a DuckDuckGo-nak tehát:
Nem ad ki adatokat a keresőkről.
Nem tárolja a keresési előzményeinket.

 
 
 
 
 
 
 
 
 
 
 
 
 
Ha valakit bővebben érdekel, hogy milyen problémái vannak Weinbergnek a Google-el kapcsolatban, annak ajánljuk, hogy olvassa végig a duckduck go privacy-val kapcsolatos honlapját.
 

Mi személy szerint nem akarunk kifejezetten vészmadárkodni a Google-el kapcsolatban, de abszolút értékeljük a DuckDuckGo hozzáállását. Csak, hogy egy szimpatikus dolgot emlitsünk: ezen az oldalon mindenki megtekintheti a keresőmotor forgalmának alakulását

Tetszett nekünk a kacsás logo, jó poénnak tartjuk az „I’m feeling ducky” módot (próbáljátok ki).  Sok cikket olvastunk a DuckDuckGo- ról és a legtöbb vélemény szerint jó alternatívája lehet a Google-nek és ez nem kis teljesítmény.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr464096547

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

kadar.akos 2012.02.15. 00:22:37

@pulykakakas: Teljesen igazad van abban, hogy maguk alatt vágják a fát. Jó meglátás.
süti beállítások módosítása