A keresés egyik alapproblémája, hogy nem ismerjük a kereső szándékát. Mire kíváncsi valaki, aki a mars szóra keres? Csillagászat, csokoládé esetleg római mitológia? Természetesen ha pontosítjuk a keresőkifejezést, akkor a találataink is pontosabbak lesznek. A SearchEngineLand-en olvastam a Penn Egyetem májusban megjelenő tanulmányáról, amiből megosztanék néhány érdekességet.
A webes keresések 80 százaléka információs, 10-10 százaléka pedig navigációs (keresek egy internet oldalt), illetve tranzakciós (pl. vennék valamit) természetű. Ha ezt tudják a keresők, segíthet, hogy a hasonló bizonytalan témák keresése esetén milyen jellegű találatokat, milyen arányban adjanak vissza. Egyébként ma már ezt általában figyelembe is veszik a keresőrendszerek (egy elrettentő kivétel: miért kellenek tematikus keresők?)
A kutatás másik érdekessége, hogy készítettek egy automatikus osztályozó rendszert, amely eldönti, hogy a fenti három kategóriából melyikbe tartozott egy keresési kifejezés. A különböző keresési típusok jellemzői:
- Navigációs keresés: cégek, szervezetek, személyek neve, domain nevek, rövid keresési kifejezések.
- Tranzakciós keresés: filmek, zeneszámok, szövegek, receptek, képek, letöltésre utaló kifejezések, szórakozási kifejezések, interakciós kifejezések (vásárlás, chat stb)
- Információs keresés: kérdőszavakat tartalmazó keresések (hogyan, mi stb), hosszabb keresőkifejezések, nem csak az első találati oldalt nézték meg stb.
Jelenleg a keresések 74 százalékában jó eredményt érnek el, ami egyrészt bíztató, másrészt aki már fejlesztett hasonló rendszereket az tudja, hogy a 80 százalékosan jó megoldást mindig sokkal könnyebb elérni, mint onnan továbblépni.
Ha valakit érdekel a komplett tanulmány (Determining the informational, navigational,
and transactional intent of Web queries) emailben el tudom küldeni.