Ez a számláló a poszt nézettségét mutatja. Mindenképp olvasd el ezt a posztot a részletekért.

HTML

Kereső Világ: keresés, szövegbányászat, big data

A keresők lelkivilága, szöveges keresés, szövegbányászat és big data.
2001 óta foglalkozunk keresőfejlesztéssel a Precognox kereteiben. A blog írói: Jóföldi Endre és Varjú Zoltán. A Goldenblog versenyen IT kategóriában a legjobb 3 blog közé választott minket a szakmai zsűri 2011-ben és 2012-ben is. 2013-ban a Biznisz blogok között hetedik helyen végeztünk.


Precognox

precognox_logo_190.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati és big data megoldásokat. Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, akkor lépj velünk kapcsolatba a céges oldalunkon található űrlapon keresztül.

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.



Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Főbb témák

adatok (12) adatújságírás (16) ajánló (4) állás (4) alternatív (6) alternatív keresőfelület (24) analitika (5) beszédtechnológia (10) big data (39) bing (14) blogkereső (5) clustering (6) computational social science (4) data science (7) digitális bölcsészet (4) egészség (7) egészség kereső (7) emócióelemzés (12) facebook (8) Facebook (7) fintech (5) firefox (4) goldenblog (5) google (57) Google (22) GoogleTrends (5) Google Ngram (4) Hadoop (6) helyi keresés (4) hírkeresés (4) internetes keresés (27) internetes keresők (4) internet hungary (6) iphone (5) johu (4) képkereső (8) keresés (50) kereséselmélet (7) keresés jövője (57) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (6) konferencia (11) korpusznyelvészet (5) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (4) linked data (5) live (13) magyar (4) magyar kereső (9) marketing (8) meetup (16) metafora (5) metakereső (4) microsoft (4) miner (4) mobil (30) mobil keresés (15) Neticle (7) nlp meetup (5) NLP meetup (4) Nuance (8) nyelvészet (7) nyelvtechnológia (48) open data (7) pénzügy (6) politika (4) Precognox (15) Precognox Labs (9) seo (5) smartmobil (4) sna (4) spam (6) statisztika (5) számítógépes nyelvészet (5) szemantikus keresés (15) szemantikus kereső (10) szemantikus web (8) szentimentelemzés (20) szövegbányászat (11) társadalomtudomány (4) tartalomelemzés (16) tartalomipar (5) tartalomjegyzék (6) tematikus kereső (20) twitter (13) Twitter (23) Twitter forradalom (4) valósidejű keresés (4) vertikális kereső (9) vizualizáció (10) wikia (4) Wikipedia (4) wolframalpha (4) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Keresőteszt: Mekkora az átfedés a Google és más keresők találatai között?

2011.02.04. 11:31 Szerző: kereso Címkék: google yandex bing keresők összehasonlítása kereső teszt exalead

Megihletett minket a héten kirobbant Bing-Google másolási botrány, ezért mi is összehasonlítottunk több keresőt a Google eredményeivel, mindenféle előítélet nélkül. Nem mondunk ítéletet, nem gyanúsítunk senkit semmivel, puszta számadatok következnek.

Előbb azonban a módszer ismertetése. Kétszer tíz kifejezést futtattunk le különböző keresőkön: Ask, Bing, Exalead és Yandex, és persze a Google.com-on, de mindegyiken amerikai IP-címről, bejelentkezés nélkül.

Az előbbi négy keresőn néztük meg, hogy mennyiben vág össze az első tíz találat a Google eredményeivel.

Próbálkoztunk a Yahoo-val (ami ugyan a Bing eredményeit használja, de bizonyos esetekben újrarendezi) és a Baidu-val is, de míg az előbbi mindössze kettő esetben adott némi különbséget a Binghez képest, az utóbbi lényegében nem mutatott egyezést, hiszen láthatóan eléggé preferálják a kínai oldalakat még angol nyelvű keresések esetében is.

Teszünk tárgyai tíz viszonylag ritka (átlagosan 96 ezer találat), de valós szavakból álló összetétel és tíz gyakori kifejezés volt, az előzőek egyszerűsített verziói.

Ritka, long tail kifejezések:

  1. compressed air torpedo
  2. "stroke after heart attack"
  3. soft compound winter tyre
  4. purpose built filling stations in Somalia
  5. rák elleni küzdelem
  6. cobalt tuning pegs
  7. Soviet doomsday weapon designs
  8. lateral g forces in speedboats
  9. diesotto engine
  10. childhood premature atrial clots

Gyakori keresőszavaink:

  1. torpedo
  2. stroke after heart attack
  3. winter tyre
  4. fillings stations
  5. rák
  6. pegs
  7. weapon desings
  8. g forces
  9. engine
  10. clot

Az eredmények az alábbiak szerint alakultak:

Átfedés a keresők eredményei között %-ban

Legnagyobb átfedést a Yandex kereső mutatta gyakori keresőszavak esetében. Azt is elmondhatjuk, hogy a Google, a Bing és a Yandex első tíz találata több mint 20 százalékban azonos. Az Ask és a francia fejlesztésű Exalead szignifikánsan kisebb átfedést mutat a Google találataival.

Fontosnak tartom még itt idézni a Dogpile által még 2007-ben készített ennél sokkal részletesebb, 19000 keresésre alapozott elemzés eredményét, miszerint akkor a Google és a Live között 6,8%-os átfedés volt. Ma ennél jelentősen magasabb a közös találatok száma.

A teszt közben megszületett a következő rész ötlete is. Érdemes lenne általánosabban nézni a kérdést, nem csupán a Google találatokhoz hasonlítva az összes többit. Folytatás következik...

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben.

Nincsenek hozzászólások.