HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Kereső beállítása a saját oldaladon

2009.03.04. 11:14 Szerző: Kereso75 Címkék: keresés saját lapon

Tegnap a Web 2.0 keretében beszéltem a keresés azon vonatkozásáról, hogyan érdemes a saját oldalainkon elérhetővé tenni a keresést.

Legfontosabb tanácsaim dióhéjban:

  • Mindenképpen legyen kereső az oldaladon. Ergonómiai kérdés is ez egyben, ahogy erről az Ergománia blogban a közelmúltban olvashattunk. Sokszor ez a legrövidebb út a tartalomig. Ott keres nálad: ne menjen el egy keresőre ezért. Te tudod legjobban mi a tartalom: crawler nem tudja. A keresődet használók a legelkötelezettebb látogatóid. Aktívak, becsüld meg őket.
  • Alapértelmezett ÉS logikájú keresés. Ezt várja kimondatlanul az ember, tehát nem logikus ha a Sólyom László kifejezésre a sólyomvadászatról és a László királyról is adunk vissza találatot. Egyébként ez az alap működési elve a kereséseknek a Google-ben is, ami szintén emellett szól, hiszen a felhasználók ezt szokták meg. Elrettentő példaként javasolnám kipróbálni a NOL, illetve MNO újságok keresőit, ami egyben azt is illusztrálja, hogy a hülyeség teljesen pártsemleges. Mindkettő alapértelmezett üzemmódban vagy logikával működik.

  • Ne szótöredékes legyen: Egy olyan nyelv esetében ahol a jelzők, ragok garmadája bármely szót a felismerhetetlenségig tud megváltoztatni, ez igen veszélyes mutatvány. Vagy legalább a szó elejére keressünk, ha nem tudja a nyelvtant a keresőnk. Elrettentő példa: Stop.hu. Keress az alma szóra, amit kapsz: egyeduralmat, izgalmat, tartlmazó, alkalmazott és így tovább...

  • Ne post-os megosztható legyen a keresési link: Sokszor küldünk valaki számára keresési eredményeket emailben. Ha POST működésre van állítva a kereső, akkor ezt lehetetlenné tesszük. Gyakorlatban ezt úgy ellenőrízheted, hogy egy keresés után látszik-e a címsorban a keresési kifejezés. pl. A miner-nél ez jól működik: http://miner.hu/?q=keres%C3%A9s

Mivel szinte az összes tartalomkezelő szoftver része a kereső, mindenképpen töltsünk néhány órát azzal, hogy beállítsuk. A felhasználóinkat sok felesleges frusztrációtól kímélhetjük meg.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

7 komment • Kövess Facebookon • Iratkozz fel értesítőre

A bejegyzés trackback címe:

https://kereses.blog.hu/api/trackback/id/tr48979581

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

kirunews 2009.03.04. 16:43:00

Szia, a második pont nem teljesen magától értetődő. A Lucene és társai alapértelmezett értéke nem az ÉS, hanem a VAGY. A Google-ben sem teljesen ÉS, csak akkor ha +-szal jelölöd meg. Ha beírsz n kifejezést, akkor találni fog olyan dokumentumot, amiben csak n-1 szó szerepel. A Solr-ban ezt például nagyon finoman be lehet állítani, pl. meg lehet olyan szabályt adni, hogy ha 3 keresőkifejezés van, akkor mind a három szerepeljen, 4 és 6 kifejezés között a kifejezések 80%-a, 6 felett pedig mondjuk a 60%-a.
A Lucene API-ban nem is OR van, hanem Should, ami kb. azt jelentheti: kívánatos a jelenléte, de bizonyos esetekben nem feltétlenül szükséges. Hozzáteszem: a Lucene-ben nem láttam ennek olyan nyílt kifejtését mint a Solr-ban).

Töredékes szavak: sajnos vég nélkül lehet sorolni az ilyen keresőket. Pl. majdnem az összes könyvesbolti kereső ilyen.

Kereso75 · http://kereses.blog.hu 2009.03.04. 17:44:18

@kirunews: Valóban előfordulhat, hogy a sokadik találatok között a Google-ben, hogy ott már nem lesz ott az összes kifejezés, de ez inkább elméleti jelentőségű.

Valóban előfordul, hogy nem az az alapértelmezett, ettől még feltétlenül ez a célszerű működés a felhasználók szempontjából. Ezt várnád egy keresőtől, nem?

kirunews 2009.03.05. 17:08:16

@kereso: azt gondolom, hogy általában az ÉS a célszerű. De nyilván nem váletlenül tesznek VAGY-ot alapértelmezésbe. Mondjuk "Kossuth Lajos" vagy "László király" keresésnél nyilván ÉS kell. És lehet, hogy ez általánosítható: ha két-három szót írunk, akkor szűkítünk, de több szónál már lehet, hogy alternatívákat írunk be. Ez részemről találgatás. Most kipróbáltam a Google-t ebből a szempontból: "+cica +macska +kutya +kutyus" jóval kevesebb (10%-nyi) találatot ad, mint a "cica macska kutya kutyus" (az idézőjeleket csak azért raktam ide, hogy lássuk a keresőkérdés elejét-végét). Ugye elvileg azt várnánk, hogy mindkettő ÉS-sel legyen összekötve. Itt távolról sem az a helyzet, hogy valahol a lista végén vannak olyan találatok, amiben a 4-ből csak 3 van, hanem a 90% ilyen. Örülnék ha erre magyarázatot tudnánk találni.

kirunews 2009.03.05. 17:09:55

Ettől föggetlenül: mindenhol az ÉS-t kell beállítani, hacsak nincs olyan lehetőségünk, mint pl. a Solr-ban, hogy finomítani tudjuk ezt a beállítást a több keresőszós keresésekre.

gabesas 2009.03.08. 11:43:57

ami kérdésként felmerült bennem: a google custom search helyett (ugye ingyenes változatban reklámokat pakol be) van olyan motor ami jólműködik pár html lapos környezetben?
volt egykét régi statikus site amire kerestem ilyesmit hogy legyenkereső, de nemtaláltam igazán jót, ahol a megjelenés testreszabható, megfelelően indexel, gyors, stb.

Kereso75 · http://kereses.blog.hu 2009.03.08. 12:36:50

@gabesas: A Yahoo BOSS API erre teljes mértékben alkalmas.

gabesas 2009.03.09. 12:58:40

ohh, köszi, pont yahoonál nem néztem és tényleg fasza.
süti beállítások módosítása