HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás alapú megoldásokat.

Az alábbi keresődoboz segítségével a Precognox által kezelt blogok tartalmában tudsz keresni. A kifejezés megadása után a Keresés gombra kattintva megjelenik vállalati keresőmegoldásunk, ahol további összetett keresések indíthatóak. A találatokra kattintva pedig elérhetőek az eredeti blogbejegyzések.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldással tudunk szolgálni szöveganalitikai problémádra, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Precognox Blogkereső

Document

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Facebook oldaldoboz

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Főbb témák

adat (8) adatbányászat (11) adatelemzés (9) adatok (13) adatújságírás (16) adatvizualizáció (19) AI (19) alternatív (6) alternatív keresőfelület (28) analitika (6) beszédtechnológia (13) big data (55) bing (14) blogkereső (6) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (9) deep learning (18) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) Facebook (9) facebook (8) gépi tanulás (18) Google (33) google (59) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) intelligens keresés (6) internetes keresés (35) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (87) kereséselmélet (8) keresési felület (6) keresés jövője (57) keresés problémái (41) keresők összehasonlítása (9) keresőmotor (16) keresőoptimalizálás (8) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (25) korpusznyelvészet (14) közösségi keresés (8) közösségi média (8) különleges keresők (7) kutatás (9) LDA (10) lda (10) live (13) machine learning (9) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (19) metafora (7) mobil (37) mobil keresés (17) Neticle (9) NLP (8) NLP meetup (17) Nuance (9) nyelv (7) nyelvészet (32) nyelvtechnológia (76) open data (12) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (65) Precognox Labs (14) Python (14) R (19) spam (6) statisztika (12) számítógépes nyelvészet (9) szemantikus keresés (19) szemantikus kereső (9) szentimentelemzés (37) szöveganalitika (7) szövegbányászat (22) társadalomtudomány (7) tartalomelemzés (56) tartalomjegyzék (6) tematikus kereső (20) topik modellek (6) twitter (15) Twitter (18) vállalati kereső (7) vertikális kereső (9) vizualizáció (13) yahoo (27) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Big Data: probléma vagy lehetőség?

2019.02.22. 12:00 Szerző: Hódi Péter Címkék: adatbázisok big data adattudomány TAS platform

A nyers adatok mennyisége várhatólag 2017 és 2019 között megduplázódik.

data-growth.png

Forrás: https://www.indexventures.com/index-insight/databases-will-inherit-the-earth

 

Mit jelent mindez és felkészültünk erre?

 

A folyamatosan felhalmozódó adatok korát éljük. Égető problémák várnak megoldásra és egyúttal rengeteg jövőbe mutató kérdés vár megválaszolásra. Az a hozzáállás, hogy a Big Data-ra (hatalmas adatmennyiségre) problémaként és egyúttal lehetőségként is tekintünk, közelebb visz a megoldásokhoz.

 

data_collector_workflow.png

Folyamatábra (adatból profit)

 

Problémák

  • Különböző adatforrások és eltérő adatformátumok
  • Adatgyűjtő, tároló és kezelő rendszerek sokszínűsége
  • Adattudós, adatelemző szakemberek hiánya
  • Adatbiztonság kihívásai
  • Anyagi befektetés szükségessége

 

Lehetőségek

  • Több és jobb minőségű üzleti információ összegyűjtése és a kinyert, strukturált adatok hozzásegítenek a hatékonyabb szervezeti működéshez
  • A kezelőrendszerek az adatok analizálásával hozzásegítenek az okosabb üzleti döntések meghozatalához
  • Az adatok vizualizációja által profibb megjelenést kölcsönöz a vállalkozásnak
  • Az adatok biztosításával egyfajta üzleti biztonságot is nyerünk
  • Az anyagi befektetés helyes célzásával profitot termelünk

 

Mire is van tehát konkrétan szükségünk?

 

Első lépésben definiálni kell, hogy milyen meglévő és megszerzendő adataink vannak. Az adatok összegyűjtése (adatbázis építés) után következhet a munka az adatokkal: tisztítás, gazdagítás, validálás és szükség esetén authentikálás. Természetesen az adatokkal történő munkát komoly előkészítési döntéseknek kell megelőzniük (Milyen formátumú adatra van szükség? Hogyan tároljuk az adatokat?) és ehhez komoly szakemberre van szükség - adatelemzőre vagy adattudósra. Sajnos ezen szakmákat kimondottan erős emberhiány jellemzi, ezért érdemes mihamarabb nekilátni a megfelelő szakember kereséséhez.  A strukturált adatokkal történő további munka – tárolás, biztosítás, vizualizálás - már a folyamat végső fázisát vetíti előre, ami nem lehet más, mint a felépített rendszer által biztosított előnyök kiaknázása: üzleti előny (profit és egyéb versenyelőny) szerzése.


Egy jól működő adatrendszer kialakítása – legyen szó akár gyűjtésről, keresésről, rendszerezésről – komoly szakértelmet kíván. A fenti problémákra a Precognox által, a piaci és egyedi igények figyelembevételével kifejlesztett TAS platform kiváló megoldást kínál.

 

A fenti blogbejegyzés alapjául szolgáló cikk az elearningindusty oldalán olvasható.

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Google Search Console – A sokoldalú analitikai eszköz

2019.02.15. 14:00 Szerző: Hódi Péter Címkék: search Google adatelemzés search console

Számtalan analitikai eszköz létezik, ami weboldalakról szolgáltat adatokat. Vannak ingyenes és fizetős szoftverek, amik különböző pontossággal feltérképezik az adott weboldalt és a látogatottságról, a különböző csatornákból érkező forgalomról, a backlinkek számáról és még sok apró részletről kaphatunk adatokat.

Egyik se tökéletes, de a hiba lehetőségeket beleszámolva, használható és értékes adatokat tudhatunk meg. Ezek közül a Google saját fejlesztése kiemelkedik, hiszen a saját weboldalam forráskódjába helyezhetem el a követőkódot és így a lehető legrészletesebb adatokat tudhatom meg.

Ez a Google Search Console, de ismerik Google Webmester eszközök néven is. Erről a sokoldalú és rendkívül hasznos analitikai eszközről lesz szó ebben a cikkben.

Cikkünket Ferge Balázs, SEO szakember készítette, aki céges weboldalak, webáruházak látogatottságának növelésével foglalkozik.

Mire tudom használni?

Tudni fogod, hogy a weboldalad hogyan teljesít kulcsszavakra. Mely aloldalak teljesítenek jobban és melyek kevésbé. Mik azok, amikre egyáltalán nem érkezik kattintás a keresőből. Ezeken tudsz akár javítani vagy levonhatsz olyan következtetéseket, amiket felhasználva egyre jobb és jobb tartalmakat hozhatsz létre, amikre több felhasználó fog érkezni.

Tehát, ha a keresőből érkező forgalmat szeretnéd növelni, akkor ehhez a legjobb visszajelzéseket a Search Console mutatja.

 

Technikai hibák kijelzése

Olyan technikai hibákat is megmutat, amiket legfeljebb külső, fizetős analitikai szoftverrel tudnál megnézni, de minek fizetni érte, ha a Google küldi ingyen az információkat? Ráadásul pontosabb adatokat, mint bármelyik külső szoftver. Bizonyos technikai hibák okozhatnak nagyobb visszaesést látogatottság szempontjából.

 

Lefedettség menüpont

A Lefedettség menüpontra érdemes 1-2 hetente ránézni és megvizsgálni, hogy a legutóbbi ellenőrzés óta növekedtek-e a technikai hibák a weboldalon. Megmutatja a 404-es, az 500-as hibákat is.

Mérlegelni, hogy azok a hibák mennyire fontosak, érdemes-e velük foglalkozni. Ez függ a weboldal nagyságától is, hiszen egy több ezer aloldallal rendelkező weboldalnál nem feltétlen okoz gondot 2-3 hiba.

 

lefedettseg-search-console.png

 

Linkek menüpont

Az egyik legfontosabb rangsorolási szempont a linkek minősége, mennyisége. Ebbe beletartoznak a kívülre mutató linkek, a belső linkek és a kívülről érkező linkek. Ezt mutatja meg a Linkek menüpont. Pontosan azt, hogy…

  • honnan érkeznek linkek
  • hány darab link érkezik
  • milyen horgonyszöveggel linkelnek
  • hány belső link van elhelyezve
  • mik a legtöbbet linkelt aloldalaid

 

Ezek nagyon értékes információk. A linképítést jelentősen befolyásolják.

 

Webhelytérkép

A webhelytérkép beküldése is egy hasznos funkció, hiszen felgyorsítjuk a keresőrobotok által történő feltérképezést. Gyorsabban beindexelik az új tartalmakat és módosításokat.

 

Kézi műveletek

A kézi műveletek menüpontnál az a jó, ha nem látsz semmit. Pontosabban azt, hogy „Nincsenek észlelt problémák!”

Ezt is érdemes 1-2 hetente megnézni és ha jelez problémát, akkor azt javítani.

 

Mobilos használhatóság

Ez a menüpont mutatja meg, hogyha probléma van a mobil verzióval. Mivel a mobilos használhatóság is rangsorolási szempont, ezért érdemes figyelni arra, hogy minden rendben legyen vele.

 

Áttekintés

Itt csak gyors áttekintést kapsz a grafikonon keresztül, hogy épp mi a helyzet a weboldallal.

 

Teljesítmény

Ez a legfontosabb menüpont. Visszamenőlegesen 16 hónapig vagy addig, amikortól ki lett telepítve a Search Console, mutatja az adatokat az organikus forgalomra vonatkozóan.

Mik ezek az adatok?

  • Milyen kulcsszavakra ér el helyezést a weboldal és mik azok a helyezések?
  • Hány kattintás érkezett összesen és külön-külön kulcsszavanként?
  • Az egyes aloldalakra hány kattintás érkezik és átlagosan milyen pozíciót érnek el?
  • Összehasonlíthatsz időszakokat attól függően, hogy mennyi ideje van aktiválva a Search Console.

 

Beállítások

Ennél a menüpontnál tudod kezelni a fiókhoz tartozó felhasználói jogosultságokat. Tudsz adni és vissza is venni, hogyha te vagy a tulajdonos.

 

Hogyan tudom használni?

Folyamatos ellenőrzésre van szükség, hogy megtudd, ha valami probléma jelentkezik. Illetve ahhoz, hogy az adatokból profitálj, azokat ki kell elemezni és tartalmat fejleszteni.

Nem kell minden jelzést és üzenetet pontosan érteni, de tudni kell, hogy mikor érdemes beavatkozni és megbízni egy szakembert a hibák javításával. Az adatok elemzéséhez is szakember szükséges, hogy tudja mit kell velük tenni. De tapasztalat útján ez is elsajátítható.    

 

Haladó használat

Haladó használathoz egy nagyon jól működő kulcsszó kutatási módszert mutatok meg.

Ezt akkor tudod használni, amikor már minimum néhány tucat vagy pár száz kulcsszóra szerepel valamilyen pozícióban a weboldal.

Search Console módszer lépései:

  1. Teljesítmény menüponton belül állítsd be az Összes kattintás, az Összes megjelenítés és az Átlagos pozíció adatokat.
  2. Rendezd a kulcsszavak listáját a pozíció szerint.
  3. Keresd meg azokat a kulcsszavakat, amik a 9-11. helyen szerepelnek.
  4. Nézd végig ezeket a kulcsszavakat és keress olyanokat, ahol kiemelkedően magas a többihez képest a megjelenítések száma, de a kattintások száma alacsony.
  5. Döntsd el, hogy ezekre a kulcsszavakra külön tartalmat kell készíteni vagy belefoglalni a meglévőbe.

Ennek a módszernek az a lényege, hogy megkeresed azokat a kulcsszavakat, amikre már viszonylag jól szerepel a weboldal, de még nem elég jól. Nem kell hozzá sok, hogy bekerüljön az első 10 találat közé és jelentősen megnőjön a kattintások száma.

Ha látsz egy kulcsszót, akkor nézd meg azt is, hogy konkrétan melyik aloldal szerepel azzal a helyezéssel. Ha átkattintassz az „Oldalak” menüpontra, akkor ezt is megmutatja.

 

Mutatok erre egy gyakorlati példát.

search-console-modszer.png

 

A képen egy olyan kulcsszót kereteztem be, amit jóval többször jelenített meg a Google a keresések alkalmával, mint a többit. A „vintage lakás” kulcsszót 73-szor, míg a többit körülötte 1-2-3 vagy 23 alkalommal. Tehát ez a kulcsszó kiemelkedik a többi közül, a Google értékesebbnek ítéli meg az egyik aloldalt erre a kulcsszóra, de még nem eléggé ahhoz, hogy megfelelő mennyiségű kattintás érkezzen rá. Ezért érdemes tartalmat adni rá.

 

search-console-modszer-aloldal.png

 

Miután átváltottam az „Oldalak” menüpontra, azt is meg tudtam, hogy melyik konkrétan melyik aloldal szerepel erre a kulcsszóra a keresőben. Más aloldalt is megadhat, de általában egy olyan lesz, ami a megjelenítések nagy részét elviszi.

Tehát, amit ezután tehetsz:

  • Új blog bejegyzést vagy szolgáltatás aloldalt készíteni az adott kulcsszóra.
  • Az adott aloldalba bele fogalmazod azt a kulcsszót külön alcímet adva neki a szövegben.
  • Minőségi linket építesz erre a kulcsszóra.

Minden helyzet más, mindig az adott helyzetben kell mérlegelni, hogy melyiket válasszuk.

 

Összegzés

A Google Search Console rendkívül hasznos eszköz, amivel rengeteg ingyenes adatot megtudhatunk a weboldalunkról. Az adatok hozzávetőlegesek, de viszonyításnak mindenképp fel kell őket használni. Így fogod tudni, hogy jó irányba tart a weboldalad látogatottságának növekedése vagy nem.

 

 

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Avicii és a frankfurti leves, avagy mit kerestünk 2018-ban

2019.02.08. 15:30 Szerző: Hódi Péter Címkék: keresés keresés jövője keresési kifejezések

A folyamatosan változó világgal és az exponenciális módon növekvő elérhető adatmennyiséggel szinte lehetetlen lépést tartani. Az emberi agy végletes befogadóképessége – és persze az elkényelmesedés – miatt nem is próbálunk mindent megjegyezni. De mi van akkor, ha szükségünk van információra? Rákeresünk, avagy ”megguglizzuk”.

A Google keresőfelületén napi szinten több mint 3,5 milliárd keresés megy végbe. A keresések történhetnek kulcsszavak (kulcs kifejezések) alapján, vagy akár Mi az a…?, Ki az a…?, Hogyan készül a…? kérdések segítségével.

7368356826_48986dc94b_o.jpg

Abban a Google Trends lesz segítségünkre, hogy megtudjuk mit kerestek legtöbben a tavalyi évben (pontosabban szólva mely keresések lettek népszerűbbek, mint 2017-ben),  Az év keresései – 2018 – érdekes korrajz, melyben az ország kiválasztásával a nemzeti keresési sajátságokat is felfedezhetjük, összehasonlíthatjuk. Így kerülhet egyszerre a látókörünkbe Avicii, a felkapott DJ és a népszerű frankfurti leves. De hogyan is?

 

 

A 2018-as év keresései 

Az ország kiválasztása után azt láthatjuk, hogy a magyar google kereséseknél Avicii a 3. helyen áll, míg Hollandiában az elsőn, Belgiumban az ötödiken. És mi a helyzet a jó öreg frankfurti levessel? Természetesen az első helyen áll a magyar recept keresések között, ez nem is meglepő, hiszen finom és tápláló ételről van szó. Az már a korábban említett korrajz alapjául szolgálhat, hogy mit keres a receptek között a harmadik, dobogós helyen a „slime recept”. Nem tudja mi az, kedves Olvasó? Guglizzon rá!

 

Recept, utazás, sláger 

A Google Trends 2018-as év kereséseinek tanulmányozása remek szórakozás, érdemes barangolni az országok lenyíló menüjének használatával. És ki tudja, talán ez alapján fog idén rátalálni új utazási célpontjára, kedvenc slágerére vagy receptjére. Az pedig 2020-ban kiderül, hogy idén mivel és mire keresünk!

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Legyünk nyitottak az adatokra!

2019.02.01. 13:55 Szerző: Hódi Péter Címkék: open data big data nyílt adatok

Légszennyezettségi adatok, illemhelyek nyitvatartási ideje, buszok és sétahajók menetrendje, utcai kamerák képe, biciklikölcsönzők elhelyezkedése, baleseti információk. Mi köti össze ezeket az információkat? Mindezen adatok elérhetőek a TfL (Transport for London) oldalán, méghozzá nyílt adatok formájában. De mit is jelent az, hogy nyílt adat?

 16443709552_5f3304643e_z.jpg

 

A nyílt adat az angol open data kifejezés kissé esetlennek tűnő tükörfordítása. A "nyílt" ebben az esetben jelenti egyrészt az adat hozzáférhetőségét, másrészt pedig a mögötte húzódó nyitott szemléletmódot.

Miért érdemes nyílt adatokat közzétenni?

A nyílt adatok publikálása mögött számos ok húzódhat meg:

 

Mitől nyílt egy adat?

Röviden szólva: attól, hogy elérhető. Természetesen attól, hogy egy adat nyilvános, még nem válik ”jó” nyílt adattá. Számos kritériumnak kell, hogy megfeleljen egy adat ahhoz, hogy arra jó nyílt adatként tekintsünk. Ezek az ismérvek:

  • pontos
  • mindenki számára ugyanolyan módon (korlátozások nélkül) hozzáférhető
  • eredetmegjelöléssel rendelkezik (az esetleges korábbi forrás megjelölésével)
  • strukturált (a felhasználási területnek megfelelő, pl.: táblázat), rendszeres közzététel esetén azonos formátumú
  • tovább szerkeszthető, bővíthető
  • könnyen megosztható
  • szükség esetén authentikált, validált

A korábban nehezen, vagy egyáltalán nem hozzáférhető adatok publikálása felgyorsult az utóbbi években, köszönhetően a technológiai háttér (adat- és szövegbányászat) fejlődésének. A Precognox komplex szöveganalitikai rendszerének - TAS - megoldásai lefedik a nyílt adatokkal történő munkavégzés fázisait, ideértve az adatgyűjtést, feldolgozást, strukturálást, adatgazdagítást, annotálást, validálást és az adatvizualizációt.

Ezeken a területeken további komoly előrelépések várhatók abban az esetben, amennyiben a technológiai akadályok elhárulása után a személyes és intézményi oldal ellenállása is alábbhagy.

Az országok által a fontosabb területeken elért ”nyitottság”-ot tükrözi az Open Data Index.

 

 A zárt, vagy nehezen hozzáférhető adatok közzétételének ellenzői és gátlói számos érvet sorakoztatnak fel, ezek:

  • saját tudás (gyűjtött adatok, know-how) üzleti titokként történő kezelése az üzleti előny megtartása érdekében
  • személyiségi jogok védelme
  • üzleti megfontolás (kizárólag üzleti nyereség szerzése esetén gyűjtenek és / vagy publikálnak adatokat)
  • személyes ellenállás (miért végezzünk karitatív munkát?)
  • túl magas időráfordítási ráta
  • emberi erőforrás hiánya

A bizalmas vagy üzleti titok kategóriájába tartozó adatok védelme magától értetődő, mindazonáltal az ezen kívül eső információk gyűjtése és nyilvánossá tétele számos előnnyel jár:

  • az emberiség fontos problémáinak megoldása (környezetvédelem, egészségügy fejlesztése a kutatások eredményeinek használatával)
  • gyorsabb, hatékonyabb munkavégzés (a technológia újabb és újabb vívmányainak elérhetővé tételével)
  • időspórolás (a kutatási fázis az adatok hozzáférhetősége miatt lerövidül)
  • gazdaságélénkítés (számos adatgyűjtéssel, autentikálással, validálással, fordítással foglalkozó vállalkozás működik pályázati támogatással, emellett ezeken a területeken tevékenykedő cégek köre bővül)
  • üzletszerzés (egy vállalkozás által publikált nyílt adatok felkelthetik a cég számára potenciális ügyfelek figyelmét)
  • közjó gyakorlása (személyes igény kielégítése)
  • kényelmesebb (magán)élet (az otthoni feladatmegoldás egyszerűbbé válik, a tanulás és szórakozás lehetőségei kibővülnek)

 

A nyílt adatok támogatói az un. Open Data Movement (Nyílt adat mozgalom) elvét vallják. Számos támogatott és önkéntes projekt fut jelenleg is, illetve újabb pályázati lehetőségek nyílnak azáltal, hogy a kormányok, kormányközi szervezetek kezdik felismerni a korábban felhalmozott tudás, illetve a kutatások, gyűjtések eredményeinek nyilvánossá tételében rejlő lehetőségeket.

A Magyarországon elérhető nyílt adatok egyik tárhelye az Opendata.hu.

A nyílt adatok gyűjtése mellett az ezen adatok felhasználására (a felhasználásban rejlő üzleti potenciál kiaknázására) létrejött vállalkozások száma is megnőtt. Ezek között akadnak olyanok, melyek egy meghatározott üzleti modell mentén olyan tartalmakat fejlesztenek, amelyek célja (gyakran csak látszólag) az életminőség javítása, de emellett az alkalmazásra, mint hirdetési felület tekintenek, tehát nem jótékony célzattal hozzák létre. Ezen alkalmazások közül azonban számos igen sikeresnek bizonyult, erősítve azt a szemléletet, hogy a nyílt adatok (áttételesen) nemcsak a közérdeket támogatják, hanem gazdaságélénkítő szerepük is van.

Az, hogy a nyílt adatoknak milyen további hatásuk lesz a későbbiekben társadalmunkra, illetve hogyan fogják megváltoztatni mindennapi életünket ma még megválaszolandó kérdés. Közös érdekünk, hogy minél több olyan adat váljon nyílttá, mely jótékony hatással van életünkre és előremutató megoldások táptalaja.

 

Források:

A cikk alapjául szolgált a  Future Learn - Using Open Data for Digital Business kurzus oktató anyaga.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

4 példa a szövegelemzés gyakorlati alkalmazására

2019.01.24. 15:24 Szerző: Hódi Péter Címkék: szövegelemzés szövegbányászat Neticle Precognox szentimentelemzés szöveganalitika

A közelmúltban a Precognox a Neticle hivatalos rendszerintegrátor partnerévé vált. Arra kértük őket, hogy az együttműködés részeként néhány példán keresztül mutassák meg hogyan látják, milyen gyakorlati felhasználási módjai vannak a szövegelemzésnek. Mivel a médiaelemző startup főleg üzleti folyamatokat és kutatási projekteket támogat saját fejlesztésű szövegelemző megoldásukkal, így ezek lesznek fókuszban az alábbiakban is. 

 neticle_cover.png

Mi az a szövegelemzés?

 

 A gépi szövegelemzés (vagy talán ismertebb nevén NLP, azaz természetes nyelvfeldolgozás) célja, hogy egy adott kulcsszóról (pl. cégről, márkáról, iparágról, kutatási témáról stb.) szóló szöveges tartalmakat rövid idő alatt, automatikusan feldolgozzunk és kiértékeljük.

A Neticle szentimentelemző algoritmusai pozitív-semleges-negatív skálán, +3-tól -3-ig értékelik a szöveges tartalmakat a bennük szereplő pozitív/negatív véleményt kifejező szavak, szerkezetek alapján, immáron 8 nyelven.  A hangvétel megállapításán kívül az algoritmusok a szövegben a központi kulcsszón kívül további kapcsolódó témákat, tulajdonságokat, márkaneveket, személyeket, helyeket, érzelmeket is felismernek és címkéznek, így mélyebb összefüggések is felfedezhetők az adott témával kapcsolatban.

 

Mire jó mindez?

 

A strukturálatlan adatnak számító szöveges tartalmakból (pl. ügyfél-visszajelzések, közösségi média kommentek, termékértékelők, kérdőív-válaszok stb.) automatikus szövegelemző szoftverrel percek alatt kinyerhetők az insightok, számszerűsíthetők és összevethetők a mennyiségi és minőségi adatok bármilyen márka vagy termék kapcsán. A feldolgozott ügyfél-visszajelzések pedig objektív alapként mutatják meg a termék-/szolgáltatásfejlesztőknek, hogy merre tovább: mik állnak a felhasználói élmény és ügyfélelégedettség útjában, és mi az, amihez érdemes ragaszkodni, visszanyúlni később is, mert a felhasználók jó visszajelzéssel vannak róla.

Mik a leggyakrabban feldolgozott szöveges tartalmak üzleti és kutatási célokra?  Hogyan hasznosulnak a szövegelemzés eredményei a gyakorlatban?  Mutatjuk ezt is az alábbiakban.

 

Online tartalmak elemzése

 

Az online médiaelemzés során az előbbieket a webes tartalomtípusokra vonatkoztatjuk. A social media kommentek, fórumos hozzászólások, cikkek, blogok alapján felmérhető valós időben, hogy egy márka, termék vagy cég megítélése éppen hogyan alakul, mi a fogyasztók véleménye, milyen tulajdonságok, témák, érzelmek fordulnak elő a releváns online beszélgetésekben, illetve kik a legaktívabb szerzők és milyen felületeken számít hot topiknak az adott téma vagy termék kivesézése.   

Az online híreket és a social media tartalmakat külön kezelve összevethető, milyen a sajtótartalmak hangvétele, saját vagy versenytársaink online PR tevékenysége mennyire eredményes az alapján, hogy a közösségi médiában milyen kép alakult ki cégünkről vagy termékünkről. A leggyakoribb szerzők alapján iparágunk mikro-influencerei és online szakértői hubok is azonosíthatók (ez utóbbi egy új csapattag keresése esetén is értékes infó), de kampányunk hatékonysága és piacunk leggyakoribb kérdései, problémái, igényeiről is képet kaphatunk az ügyfélhangokat nyomon követve. Az online médiaelemzési adatok  15 leggyakoribb felhasználási módját egy külön írásban is összegyűjtöttük.

 

Ügyfélvisszhangok elemzése

 

Az üzleti életben nemcsak a cégünkről, márkánkról, versenytársainkról vagy piacunkról szóló említések adnak komoly alapot a folyamatok meghatározásához, hanem a közvetlenül begyűjtött ügyfélhangok pl. kérdőívekre adott visszajelzések, termékértékelők is. Ezek elemzésével képet kaphatunk szolgáltatásunk gyenge pontjairól és erősségeiről az ügyfeleink szemszögéből. Előbbieknek a termékfejlesztők fognak örülni, utóbbinak vállalatunk marketingesei, akik a legpozitívabban értékelt termékelőnyökre kampányok és hirdetések üzeneteit alapozhatják.

Ezen kívül a HR divízió is hálás lesz, ha objektív adatokon keresztül láthatják a szervezeti súrlódások okait. A munkavállalók megkérdezésével, egy elégedettségi kérdőív gyors kiértékelésével a szervezfejlesztéshez kapnak értékes és direkt inputokat. A szöveges visszajelzések, értékelések felhasználási esetekről is készítettünk egy összefoglalót.

 

Kutatási projektek, felmérések

 

Kutatási projektekhez, társadalmi témák webes elterjedtségét, megítélését is mérhetjük a szöveges tartalmak elemzésével. A non-profit szervezetek és szakdolgozók is egyre inkább felfedezik a szövegelemző szoftverek kutatási előnyeit. A Neticle egyik legérdekesebb, a Hintalovon alapítvánnyal közös kutatásában az olyan tabutémával kapcsolatos tartalmakat gyűjtötte össze és elemezte, mint az „első csók”, „első szex”. Az együttműködés eredményeinek összefoglalója a tinédzserek viszonyulásáról ezekhez a bizonyos elsőkhöz publikusan is elérhető.  

 

Integrációs megoldás is lehetséges

 

Neticle által készített szövegelemző függvények most már bárki számára elérhetőek, ugyanis 2015 júliusától az integrálható megoldás is megrendelhető, felhő alapon vagy on-premise, azaz a felhasználó saját rendszerébe integrálva. A Precognox rendszerintegrációs partnerként pont ilyen esetekben tud hatékonyan segíteni. A leggyakoribb esetek, amelyeknél a Neticle Text Analysis API időt spórol és értékes insightokat nyújt a partnereknek, azok az ügyfélszolgálat támogatása, e-mailes panaszüzenetek és chatbot beszélgetések kategorizálása, CRM és ERP rendszerek adatainak strukturált kezelése a tapasztalt ügyfélesetek alapján, de egyéb példák is vannak: bármilyen iparágspecifikus belsős szöveges adatállomány elemzéséhez (pl. önéletrajzok, termékértékelők) és adatgyűjtéshez (cikkek, sajtóanyagok) is  igénybe veszik.  

A szövegelemzés vagy NLP felhasználási lehetőségei ott merülnek ki, ahol a szöveges adatok is elfogynak, azaz nagyjából végtelenek. A strukturálatlan szöveges tartalmak, legyenek azok már a birtokunkban vagy még kibányászásra várva a web különféle platformjain olyan értékes információkat hordoznak, amik új megvilágításba helyezik az üzleti döntéseket és kutatási területeket is. 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

süti beállítások módosítása