HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (18) google (59) Google (33) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) lda (10) LDA (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) Twitter (18) twitter (15) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

A szöveges keresés 14 problémája

2010.05.26. 10:25 Szerző: siklosib Címkék: kereső szándéka keresés problémái keresési kifejezések keresők viselkedése szöveges keresés

 Minél többet használjuk az internetes keresőket, annál gyakrabban kerülünk olyan helyzetbe, hogy nem tudjuk hogyan fogalmazzuk meg mit is keresünk, hiszen önmagában beírva a kifejezést nem azokat az eredményeket fogjuk kapni, amit szeretnénk. A keresők éppen ezért gyakran jelentkeznek olyan újításokkal, amelyek a természetes nyelvi feldolgozást, szemantikus keresést, mély webes keresést hangsúlyozzák.

Jeffrey Beall, a Colorado Denver-i egyetemről összeállított egy listát arról, hogy mik a jellemző problémák, a szöveges keresés nehézségei:

  1. Szinonímák: rákereshetünk egy kifejezésre, de biztosan nem fogjuk az összes szinonímája mentén is elvégezni a keresést. Így a keresett információnak csak az a része jut el hozzánk, ami pontosan az általunk beírt alakban tartalmazza a kifejezést.
  2. Elavult kifejezések: sokszor nem gondolunk egy-egy kifejezés elavult formájának keresésére. Például a filmek történetéről való keresés során nem gondolunk a mozgókép kifejezésre.
  3. Homonímák: több jelentésű, azonos alakú szavak esetén a kereső nem tudja eldönteni, hogy melyikre gondolunk, ezért az eredmény elég zajos lesz.
  4. Spam-ek: az internet tele van "szeméttel", nem megfelelő minőségű, olykor éppen valótlan információkkal, amelyeket a keresők nem tudnak megkülönböztetni a megbízható forrásoktól.
  5. Az eredmények szűkítésének hiánya: az eredmények csoportosítása, finomítása ritkán jelenik meg a keresőknél.
  6. Az eredmények rendezése: mivel a keresők nem sok adatot tudhatnak a kapott eredményekről, ezért nehéz bármilyen rendezési szempontot megvalósítani (pl keletkezés dátuma).
  7. Tartalmi problémák: attól, hogy egy oldal tartalmazza az általunk beírt kereső kifejezést, még nem biztos, hogy arról a témáról szól.
  8. Képletes leírások: rákereshetünk a repülés szóra és kaphatunk olyan eredményeket, melyek arról szólnak, hogy valaki repül örömében.
  9. A keresett kifejezés nem szerepel egy releváns oldalon: létezhet olyan leírás egy témáról, ami egyáltalán nem említi az adott formában a keresett kifejezést.
  10. Elvont témák: olyan nehezen megfogható témákról, mint egészség, szabad akarat, erkölcs nehezen találhatunk eredményeket. Az ilyeneknek nincs lexikai leírása, illetve ha van, nagy valószínűséggel akkor sem ezeket keressük.
  11. Több téma kapcsolata: ha két kifejezés kapcsolatára keresünk, előfordulhat, hogy olyan eredményeket kapunk, ahol mindkét kifejezés szerepel, de egymástól teljesen függetlenül, a kettő közötti kapcsolatról nem esik szó.
  12. Szó listák: a keresés eredményei származhatnak internetes szótárakból, felsorolásokból, szólistákból, amelyek az esetek nagyon kis százalékában felelnek meg a kereső szándékának.
  13. A mély web: a legtöbb minőségi információ nem a Google és a többi kereső által elérhető felszínen található, hanem az ún mély weben, amiket így nehéz elérni.
  14. Nem szöveges adatok: a megfelelő leírás, meta információk nélküli nem szöveges adatok elérése nagyon nehéz.
Bár a különböző keresők fejlesztői egyre nagyobb hangsúlyt fektetnek ezen problémák megoldására, egyelőre még valóban problémát jelentenek, a gépek emberi intelligenciától való távolságát bizonyítva. Mit tehetünk ha mégis minőségi információkra, esetleg tanulmányokra van szükségünk egy-egy kutatáshoz? Jeffrey Beall szerint érdemes a nagy könyvtárak adatbázisaihoz fordulni, amik bár szintén szöveges információk keresésén alapulnak, számos problémától mégis mentesek.

 

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

2 komment • Kövess Facebookon • Iratkozz fel értesítőre

Interjú a Wolfram Alpha alapítójával

2010.05.19. 11:08 Szerző: siklosib Címkék: kutatás internetes keresés különleges keresők tudományos kereső wolframalpha

 A Wolfram Alpha egy igazán tudományos kereső. 2009 elején indult, azóta is új funkciókkal egészítik ki, folyamatosan fejlesztik, mégsem sokat hallunk róla. Megjelent egy interjú a Wolfram Research alapítójával, Stephen Wolfram-mal, aki néhány kérdésre választ adott.

A múlt

Amikor elindult, a fő kérdés az volt, hogy vajon lehetséges-e a weben található rengeteg adat alapján számításokat végezni, összefüggéseket találni egy-egy keresés esetén. Bár az indulás során ez a felhasználói élmény hiányosságai miatt nem volt látványos, mára egyértelműen megvalósult. A kezdeti verzióhoz képest mára a használhatósága és a feldolgozott adatmennyiség is sokat javult és az egyre nagyobb tapasztalatoknak köszönhetően egyre nagyobb léptékben haladnak továbbra is. Mára a felhasználók nagy része tisztában van vele, hogy a Wolfram Alpha nem egy általános kereső.
 
A munka nagy része
 
A kutatók álláspontja szerint a web önmagában nem elég a nyers információk színvonalas prezentálására, ezért elsődleges adatforrásokhoz nyúlnak vissza. Ezeknek a megszerzése, bár az elérhető források zártsága miatt nem egyszerű, de az ezután következő feldolgozáshoz képest csupán a munka 5 %-át teszi ki. Az igazi nehézséget az adatok megértése, a felhasználói szándékok szerinti feldolgozása, anomáliák felfedezése jelenti.
 
Népszerűsítés
 
A jelenlegi feladat az, hogy a Wolfram Alpha minél több csatornán keresztül minél több emberhez eljusson. Ehhez elsősorban a fejlesztéseken, illetve a mások számára való integrálhatóságon keresztül szeretnének eljutni.
 
 
 
A jövő
 
Ez az új feldolgozási lehetőség még a kezdet kezdetén jár, évek szükségesek ahhoz, hogy kiderüljön mire is képes. A közeljövőben azonban szerepelnek olyan tervek, hogy lehetőséget nyitnának saját adatok feltöltésére és elemzésére, a szintén a cég által fejlesztett Mathematica program komolyabb bekötésére, illetve a természetes nyelvi lekérdezések megértésére. Ezek kombinációja által például megvalósulhatna az, hogy a Mathematica nyelven programozók természetes nyelvi utasításokkal fogalmazhassák meg utasításaikat.
Természetesen folyamatosan történik az adathalmazok bővítése, újabb tudományos területek bevonása is.
 
Az eredeti cikk itt olvasható.

 

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

2010 az Év Fiatal Informatikai Vállalkozója Díj

2010.05.19. 10:48 Szerző: Kereso75 Címkék: gyúrós tibor díj

Nagy megtiszteltetés számomra, hogy jelöltek az 2010-es Év Fiatal Informatikai Vállalkozója díjra. A győzteseket egy szakmai zsűri választja majd ki, de lehetőség van közönségszavazásra is. A díjat az IVSZ 1997 végén alapította, tragikus repülőgép balesetben elhunyt akkori elnökének, Gyurós Tibor emlékének szentelve.

Megtisztelsz vele, ha szavazol rám. A szavazáshoz regisztrálni kell az IVSZ oldalán. Ha beléptél megjelenik a szavazási lehetőség.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Keresők a böngészőben

2010.05.07. 13:11 Szerző: siklosib Címkék: firefox internetes keresés iexplorer keresés böngészőből kereső mező kereső teszt

 Az internetes keresés nem egy önmagában élő műfaj. Nagyon ritka az az eset, amikor valaki különösebb cél nélkül csak azért ül le a gép elé, hogy mindegy mit, csak valamit keressen. Ebben az esetben nem számít az a három-négy kattintás, új oldalak megnyitása, ami elvezet odáig, hogy a keresést el lehessen kezdeni.

Az esetek többségében azonban nem ez a jellemző. Amikor keresünk valamit, az csak egy kiegészítés, információszerzés azzal kapcsolatban, amivel éppen foglalkozunk. Nagyon futurisztikus megközelítésben az volna a legkényelmesebb, ha már a gondolatainkat is érzékelné a számítógép és ahol valamilyen ismereti hiányosságot észlel, a szükséges információkat azonnal automatikusan megjeleníti.

Itt még nem tartunk, de a legnépszerűbb böngészők bizonyos mértékben egyszerűbbé tehetik a keresés folyamatát a beépített kereső mező használatával. Fontos szempont a kényelem, de mit sem ér, ha nem a megszokott keresőinket használhatjuk. Természetesen erre is van mód.

Firefox

A beépített kereső mező a böngésző jobb felső sarkában található. A sor elején a kis nyilacskával lenyitható a jelenlegi telepített keresők listája. Itt választhatjuk ki, hogy éppen milyen speciális, vagy általános keresőt választunk. Már itt megéri eltárolni a leggyakrabban használt keresőket, hiszen nincs szükség mindig újabb lapok megnyitására, innen rögtön a kiválasztott mód szerint kereshetünk.

 

 

 

 

 

Keresőszolgáltatások kezelése menüpont további keresők hozzáadására, illetve a már beépült keresők sorrendjének meghatározására ad lehetőséget.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A „További keresők letöltése” linkre kattintva megjelenik a Firefox kiegészítők listája, ahol böngészéssel vagy kereséssel találhatjuk meg kedvenceinket. 

 

 

 

 

 

 

 

 

 

 

 

A kiválasztott kereső „Add to Firefox” gombjára kattintva a kereső be is épült, könnyen, gyorsan használhatóvá vált.

IExplorer

Ennél a böngészőnél a személyre szabhatóság kevésbé rugalmas, mint az előző társa esetén, de itt is van lehetőség keresők beállítására. Szintén a böngésző jobb felső sarkában található a keresőmező.

Itt a mező jobb oldalán van a lenyitható menü, ahol szintén választható a használni kívánt kereső, illetve a „Keresésszolgáltatók kezelése” pont a további beállításokhoz visz. 

 

 

 

 

 

 

 

 

 

 

 

A listában szereplő keresők sorrendjén és az alapértelmezett kereső kiválasztásán lehet állítani, illetve itt is tölthetünk le továbbiakat a microsoft kiegészítő gyűjteményéből, ahol az „Add to Internet Explorer” gomb indítja el a telepítést.

 

 

 

 

 

 

 

 

Ezek a lehetőségek a mindennapi kényelmes használatot segítik elő, fontos szempont tehát a felhasználói élmény figyelembe vétele. Ennek érdekében érdemes a bevált keresőket  a letöltési linknél megtalálható elérési lehetőségen keresztül értékelni, illetve ismerőseinknek tovább ajánlani.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

1 komment • Kövess Facebookon • Iratkozz fel értesítőre

Kereső Világ a Facebookon is

2010.05.06. 08:38 Szerző: Kereso75 Címkék: facebook internetes keresés

Tegnap létrehoztam a Kereső Világ Facebook oldalát. Nem úgy tekintek rá, mint egy másik csatornára, ahol ugyanazokat a tartalmakat lehetne ismételni az újrahasznosítás jegyében.

A bloggal szemben a Facebook oldalon meg fogjátok találni azon cikkeknek az ajánlásait is, amit naponta olvasok a kereséssel kapcsolatban. Ezek ugyan valamilyen szempontból fontosak, érdekesek, de nem ihlettek önálló bejegyzés írására, vagy csak egyszerűen nem volt akkor éppen több időm.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása