HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (7) adatbányászat (10) adatelemzés (7) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (16) alternatív (6) alternatív keresőfelület (26) analitika (6) beszédtechnológia (13) big data (53) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (16) Google (31) google (58) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (31) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (79) kereséselmélet (8) keresés jövője (55) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (12) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (7) LDA (10) lda (10) live (13) machine learning (6) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (16) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (31) nyelvtechnológia (75) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (61) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (21) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) Twitter (18) twitter (15) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Hamarosan rajtol az NLP Summit 2021

2021.09.10. 09:10 Szerző: Hódi Péter Címkék: rendezvény summit nyelvtechnológia NLP Precognox természetes nyelvfeldolgozás

nlp_summit_2021.png
Az idei évben október 5-7 között kerül megrendezésre az NLP Summit, ezúttal is az online térben.

Az eseményre már lehet regisztrálni az NLP Summit honlapján.

Mi az NLP Summit?

Az NLP Summit a természetes nyelvfeldolgozás területén dolgozók találkozóhelye. A virtuális konferencia valós esettanulmányokon túl bemutatja az NLP legjobb gyakorlatait, a deep learning alkalmazásának kihívásait, illetve a legújabb nyílt forráskódú könyvtárakat, modelleket. Az NLP Summit összehozza a folyamatosan bővülő NLP-közösség tagjait, akik az egészségügyben, a tudományban, a pénzügyben, az e-kereskedelemben, a médiában, a munkaerőpiacon és más területeken használt nyelvi alkalmazások kiépítésében érdekeltek.

Mi történt a 2020-as eseményen?

A tavalyi NLP Summit 2020 előadásai elérhetőek, így lehetőség nyílik, hogy még az idei esemény előtt megtekinthessük a 2020-ban készült videókat, mégpedig 4 témakörben:

  • trendek és legjobb gyakorlatok
  • nyílt forráskódú könyvtárak
  • NLP az egészségügyben
  • beszélgetések a gépekkel

Mi várható az idei NLP Summit-on?

Az NLP Summit idén 30 egyedülálló előadást ígér, méghozzá külön fókuszálva az NLP az egészségügyben témakörre. Emellett kezdő és haladó szintű képzési workshopok lesznek, ahol tanúsítványok is szerezhetőek. Az eseményhez csatlakozók részt vehetnek egy datathon-on is, illetve beszélgethetnek az előadókkal és az iparági szakértőkkel.

Jó szórakozást és fejlődést kívánunk az eseményhez!

Tudj meg többet a természetes nyelvfeldolgozásról és felhasználási területeiről!

 

Kép forrása: az NLP Summit honlapja

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Moderáld magad! Vagy megteszik helyetted az algoritmusok.

2021.08.19. 12:42 Szerző: Hódi Péter Címkék: automatizálás mesterséges intelligencia moderálás algoritmus szövegbányászat gépi tanulás AI NLP szöveganalitika machine learning természetes nyelvfeldolgozás

Tudományos értekezések, esszék, blogcikkek, közösségi média posztok és még számtalan tartalom, amely manapság egyre nagyobb mennyiségben árasztja el az online világot. És természetesen ennek megfelelően a tartalmakhoz fűzött kommentek száma szintén folyamatosan emelkedik. Ezen hozzászólások manuális, egyenkénti moderálása hatalmas idő-és erőforrás igénnyel bír, így egyre nagyobb szükség van a folyamat automatizálására.

Segítség a moderálásban

A szöveges tartalmak automatikus moderálásában több terület közös együtműködése szükségeltetik. Ezek a

A mesterséges intelligencián alapuló megoldások mára már képesek a szöveges tartalmak, például termék- vagy szolgáltatásértékelések, ügyfélszolgálati csevegési naplók vagy a közösségi médiás bejegyzések valós időben történő felülvizsgálatára. A természetes nyelvfeldolgozás segítségével a mesterséges intelligencia sokkal gyorsabban felismeri a nem megfelelő tartalmakat, mint egy emberi moderátor, és így biztosítani képes, hogy azok ne csússzanak át a “radar alatt”.

Miért fontos a valós idejű moderálás?

Egy-egy népszerű tartalmat hihetetlen gyorsasággal kap fel például a közösségi média. A megosztásoknak köszönhetően szinte exponenciálisan emelkedik egy adott poszthoz érkező hozzászólások száma, ezek manuális szűrése valós időben szinte lehetetlen. Azonban ennek megoldása feltétlenül szükséges, gondoljunk csak a jogi következményekre. Mivel a társadalmi érzékenység egyre nő, így egyre fontosabbá válik a szöveges tartalmak szűrése, különös tekintettel az ún. gyűlöletbeszéd elleni fellépés tekintetében.

szavak_ereje.jpg

a szavak nagy erővel bírnak, különösen a rosszak

Létezik tökéletes automatizált megoldás?

Egyelőre a válasz: nem. A folyamatosan változó nyelvi kifejezések, rövidítések, a szleng és például a szubkultúrális jelentéssel bíró szöveges tartalmak mind-mind azt teszik szükségessé, hogy egyre kifinomultabb megoldásokat, illetve ezek kombinációját kell alkalmazni a moderálás során. A kommunikáció állandó változásával, (vissza)fejlődésével lényegében az algoritmusok mindig is egy lépés lemaradásban lesznek.

yolo.jpg

mindig van új a nap alatt, ha a kifejezésekről és a rövidítésekről van szó

A leghatásosabb megoldás tehát az lenne, ha mindenki moderálná magát, mielőtt sértő, illetve nem megfelelő szóhasználattal élne, legyen szó egy cikk megírásáról vagy egy komment megfogalmazásáról. Amennyiben ez pedig nem sikerül, akkor még mindig segíthetnek az algoritmusok.

 

A fejlett szöveganalitikai megoldásokról többet is megtudhat a Precognox honlapján.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Már elérhető a Google Search Console Insights

2021.07.26. 09:21 Szerző: Hódi Péter Címkék: google analitika elemzés insight Google adatelemzés search console

Egy évvel a béta verzió után a Google élesben is elindította a Search Console Insights-ot, amely mindazok számára elérhető, akik korábban már rendelkeztek ellenőrzött Search Console profillal. A Search Console Insights jelentések a search.google.com/search-console/insights címen érhetőek el.

Mi az a Search Console Insights?

A Search Console Insights kifejezetten a tartalomkészítők és az azokat online publikálók számára készült. A szolgáltatás "segíthet nekik megérteni, hogy a közönség hogyan fedezi fel webhelyük tartalmát, és mi az, ami számukra vonzó tartalom" - állítja a Google. A Search Console Insights a Search Console és az Analytics adataiból egyaránt merít.

Mikor indult el a szolgáltatás?

A Google tavaly indította el a Search Console Insights bétaverzióját, majd korlátozott hozzáférést adott néhány tartalomkészítő számára, hogy azt tesztelhessék (hibakeresést végezzenek) és visszajelzést adjanak erről Google felé. Akkor a Google azt mondta, hogy "ez egy olyan mód, amellyel a tartalomkészítők rendelkezésére bocsátjuk azokat az adatokat, amelyekre szükségük van ahhoz, hogy megalapozott döntéseket hozzanak és javítsák tartalmaikat".

searc_console_insights.png
néhány példa az új jelentésekről - forrás: Search Engine Land

Milyen kérdésekre ad választ az új platform?

A Search Console Insights jelentéseinek célja, hogy választ adjanak az alábbi kérdésekre:

  • Melyek a legjobban teljesítő tartalmaink?
  • Hogyan teljesítenek az új tartalmak?
  • Hogyan fedezik fel az emberek az adott webhely tartalmait?
  • Mire keresnek az emberek a Google-on, mielőtt meglátogatják tartalmainkat?
  • Melyik cikk irányítja a felhasználókat a weboldalunkra és annak tartalmára?

Hogyan férhet hozzá a felhasználó a Search Console Insights-hoz?

A Google többféle módot is kínál a jelentések eléréséhez:

  • válasszuk a Search Console fő oldalának tetején található Search Console Insights menüpontot
  • használjuk ezt a linket a közvetlen eléréshez
  • az iOS Google alkalmazásban válasszuk a Search Console Insights pontot a felhasználói menüben (a profilképre kattintva). Ez a lehetőség hamarosan az Android alkalmazásban is megjelenik.



searc_console_insights_elehetoseg.png
a Search Console Insights-ot a Search Console fő oldalán a jobb felső sarokban találjuk

Hiányzó adatok

Amennyiben hiányoznak bizonyos adatok az új felületen, az azt jelenti, hogy a Search Console és a Google Analytics tulajdonunk nincs megfelelően összekapcsolva. A Google azt ajánlja, hogy társítsuk azokat össze annak érdekében, hogy megfelelően hozzáférjünk a jelentésekhez. A Search Console Insights egyelőre csak a Google Analytics Universal Analytics tulajdont támogatja (ezek azonosítója "UA"-val betűvel kezdődik), de a vállalat már dolgozik a Google Analytics 4 támogatáson.

Miért hasznos a Google Search Console Insights?

A bevezetett mérőszámokkal új módon vizsgálhatjuk meg adatainkat.Több adatot és nézetet is kapunk, így több lehetőség áll a rendelkezésünkre tartalmaink teljesítményének megismerésére és megértésére, ami rendkívül hasznos a tudatos tartalomkészítés szempontjából. Így mindenképpen érdemes megnézni és kipróbálni a Search Console Insights-ot, amely új tartalom- és marketingötleteket adhat vállalkozásunk számára.

Amennyiben többet szeretne a témáról megtudni, kérjük olvassa el a Search Engine Land oldalán megjelent angol nyelvű cikket, amely jelen blogbejegyzésünk alapjául is szolgált.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Hogyan fedezzük fel a TikTok tartalmakat?

2021.07.07. 08:51 Szerző: Hódi Péter Címkék: keresés videómegosztó felfedezés közösségi média keresőfelület TikTok

Mi az a TikTok?

A TikTok egy videomegosztó szolgáltatás, amelyett 2012-ben alapított a pekingi székhelyű ByteDance cég. Az alkalmazás, amely Kínán kívül 2017-ben jelent meg iOS és Android platformokra, lehetővé teszi a felhasználók számára, hogy 15 másodperces videókat készítsenek és osszanak meg bármilyen témában.

A 2021 januári TikTok-statisztikák szerint a platformnak világszerte 689 millió havi aktív felhasználója volt, amely ezzel a hetedik legnagyobb platform a felhasználók számát tekintve, megelőzve olyan, jóval régebb óta létező platformokat, mint a Snapchat, a Pinterest és a Twitter.

tiktok.jpg

Mi az a Discover (Felfedezés)?

A TikTok keresőjének segítségével kereshetünk és fedezhetjük fel a TikTok közösség sokféle tartalmát: trendi videókat, hashtageket, alkotókat és szponzorált tartalmakat.

Megjegyzés: A hashtag oldalakon az első néhány videó az adott trendet elindító videók és más népszerű videók, amelyek a hashtaghez kapcsolódnak.

Hogyan tudunk keresni?

Konkrét videók, hangok, hashtagek vagy alkotók kereséséhez:

  1. érintsük meg a képernyő alján található Discover gombot
  2. keressünk rá egy adott videóra vagy tartalomtípusra az oldal tetején található keresősávban. Legyünk minél konkrétabbak a keresési kifejezések alkalmazásakor
  3. az eredmények a felső lapon jelennek meg
  4. nézzük meg a többi keresési lapot is a kapcsolódó tartalmakért*

Természetesen a fentieken túlmenően kereshetünk a felhasználók és a top (legnépszerűbb) tartalmak között is.

* forrás: TikTok support

tiktok_discover.png

Tartalmak a TikTok-on

A népszerű TikTok tartalmakat hamar felkapják a felhasználók, de azok ugyanilyen gyorsan “el is tűnnek a süllyesztőben”. Éppen emiatt a jelenség miatt érdemes a kedvenc tartalmainkat menteni, vagy lájkolni, mert enélkül szinte lehetetlen azokat újra megtalálni. Azt pedig mindenki eldöntheti, hogy a rengeteg megosztott tartalom közül mit tart érdekesnek, értékesnek vagy éppenséggel viccesnek.

 

Kapcsolódó cikkünk a keresésről: Keresőmotor vs. vállalati keresőmotor

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Természetes nyelvfeldolgozás: miért hallunk róla egyre többet?

2021.06.25. 09:03 Szerző: Hódi Péter Címkék: keresés nyelvészet nyelvtechnológia NLP számítógépes nyelvészet


Egyre gyakrabban hallunk a természetes nyelvfeldolgozásról. De vajon mi is ez a terület és miért örvend egyre nagyobb népszerűségnek?

Mi a természetes nyelvfeldolgozás?

A természetes nyelvfeldolgozás (NLP) a nyelvészet, a számítástechnika és a mesterséges intelligencia egyik részterülete, amely a számítógépek és az emberi nyelv közötti kölcsönhatásokkal foglalkozik, különösen azzal, hogy hogyan lehet a számítógépeket nagy mennyiségű természetes nyelvi adat feldolgozására és elemzésére programozni.*

Keveredés az NLP rövidítés körül

Az NLP rövidítés cikkünk esetében a Natural Language Processing kifejezést takarja, de ugyanezt a mozaikszót alkalmazzák a Neuro Linguistic Programming fogalom használatakor is. A neuro-lingvisztikus programozás azonban a pszichológiai területén használatos kifejezés, módszer.

Miért fejlődik rohamosan a természetes nyelvfeldolgozás?

Az NLP (natural language processing) területén megjelenő számos új információ, kutatás és fejlesztés jelzi, hogy egyre fontosabb szerepet játszik a természetes nyelvfeldolgozás a mindennapi életünk során. Mi indokolja ezt? Ennek számos oka van, vegyük ezeket sorra!

A múlt információinak feldolgozása

Az emberiség egyetemleges tudása, illetve a megőrzendő információk rögzítése korábban csak kézzel írott, nyomtatott (könyvnyomtatás), később pedig gépelt formában volt lehetséges. Ezen dokumentumok feldolgozása rendkívül fontos, ám nagyon időigényes folyamat. Köszönhetően a természetes nyelvfeldolgozás területéhez szervesen kapcsolódó eljárásoknak, mint például a digitalizálás és az OCR (optikai karakterfelismerés) mára már lehetséges a papír alapú dokumentumok tömeges feldolgozása.

tekercs.jpg

Növekvő adatmennyiség

Mai világunkban az előállított adatmennyiség (szöveges tartalmak) exponenciálisan nő. Gondoljunk csak a vállalati közegben keletkező dokumentumokra, a kutatási anyagokra, a megannyi blog, közösségi média tartalmaira vagy éppen a szöveges üzenetekre. Ezek is mind-mind alapjául szolgálnak a természetes nyelvfeldolgozásnak és a további szöveganalitikai megoldásoknak.

Keresési igények megnövekedése

Nap mint nap számos keresést hajtunk végre információk után kutatva a keresőmotorok segítségével. Legyen szó akár személyes érdeklődés kielégítéséről vagy üzleti, kutatási célú felhasználásról, egyre nagyobb az igényünk az információk egyszerű és könnyű megtalálására. A releváns információk megtalálásában is komoly segítséget jelentenek a nyelvfeldolgozás vívmányai.

nlp_kereses.png

Speciális szolgáltatások

Számtalan olyan szolgáltatási területen is előretörést tapasztalhatunk, amelyek néhány évvel ezelőtt még vagy nem is léteztek, vagy csak gyerekcipőben járt a hozzájuk kapcsolódó technológia. Gondolhatunk itt az automatizált digitális tartalmakra (kérdőívek, bejelentkezési és regisztrációs form-ok, adatigénylési- és szolgáltatási dokumentumok), de az egyik legeklatánsabb példa a chatbotok megjelenése és fejlődése.

chatbot.png

Kapcsolódó területek fejlődése

A természetes nyelvfeldolgozás számtalan területhez kapcsolódik, így a szoftverfejlesztéshez, szöveganalitikához (adatgyűjtés-és címkézés, szentimentelemzés, intelligens keresés, névazonosítás, nyelvfelismerés), adatvizualizációhoz, nyelvészethez, robotkommunikációhoz vagy például a gépi fordításhoz. Ezen területek rohamos fejlődése is nagyban hozzájárul ahhoz, hogy a természetes nyelvfeldolgozás még hosszú ideig meghatározó szerepet fog játszani az emberiség jövőjében.

A fent felsoroltak mellett még számos oka lehet annak, hogy egyre többet hallunk a természetes nyelvfeldolgozásról, amelynek hasznossága a mai kor számára megkérdőjelezhetetlen. Az is kijelenthető, hogy a területben még rengeteg potenciál rejlik, melynek kiaknázásával a jövőben sokkal kényelmesebbé és egyszerűbbé válik a szöveges tartalmakhoz kapcsolódó folyamatok megvalósítása.

 

Szeretne többet megtudni a természetes nyelvfeldolgozásról? Csatlakozzon az NLP Meetup közösséghez!

 

* Fordítás az angol Wikipédia-ról

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása