HTML

Precognox

 precognox-logo-cmyk-620.jpg

A blog készítői a Precognox Kft. keretein belül fejlesztenek intelligens, nyelvészeti alapokra épülő keresési, szövegbányászati, big data és gépi tanulás megoldásokat.

Ha a blogon olvasható tartalmak kapcsán, vagy témáink alapján úgy gondolod megoldhatjuk problémáidat, lépj velünk kapcsolatba a keresovilag@precognox.com címen.

Star Wars text mining

visualizing_star_wars_movie_scripts_precognox.jpgA long time ago, in a galaxy far, far away data analysts were talking about the upcoming new Star Wars movie. One of them has never seen any eposide of the two trilogies before, so they decided to make the movie more accessible to this poor fellow. See more...

Facebook oldaldoboz

Meetup ajánló

Blog figyelése (RSS)

 Add hozzá az RSS olvasódhoz

Ha levélben szeretnél értesülni az új cikkekről:

opendata.hu

opendatahu45.jpg

Az opendata.hu egy ingyenes és nyilvános magyar adatkatalógus. Az oldalt önkéntesek és civil szervezetek hozták létre azzal a céllal, hogy megteremtsék az első magyar nyílt adatokat, adatbázisokat gyűjtő weblapot. Az oldalra szabadon feltölthetőek, rendszerezhetőek szerzői jogvédelem alatt nem álló, nyilvános, illetve közérdekű adatok.

Az opendata.hu oldalt a Magyar OpenData Alapítvány/Egyesület hivatalos megalakulásáig - lelkes önkéntesek segítségével a
K-Monitor Közhasznú Egyesület (K-Monitor) működteti, az üzemeltetést a Precognox végzi.

Főbb témák

adatbányászat (6) adatok (12) adatújságírás (16) adatvizualizáció (17) AI (14) alternatív (6) alternatív keresőfelület (24) beszédtechnológia (13) big data (48) bing (14) CEU (6) clustering (6) conTEXT (8) dashboard (6) data science (8) deep learning (15) egészség (7) egészség kereső (7) előadás (7) emócióelemzés (35) facebook (8) Facebook (9) gépi tanulás (15) google (57) Google (23) gyűlöletbeszéd (7) hackathon (10) hálózatelemzés (14) internetes keresés (26) internet hungary (6) képfeldolgozás (8) képkereső (8) keresés (57) kereséselmélet (7) keresés jövője (55) keresés problémái (38) keresők összehasonlítása (9) keresőoptimalizálás (6) kereső szándéka (11) kereső tanfolyam (9) kereső teszt (15) kognitív nyelvészet (12) konferencia (46) könyvajánló (24) korpusznyelvészet (14) közösségi keresés (8) közösségi média (6) különleges keresők (7) kutatás (6) lda (10) LDA (10) live (13) magyar kereső (9) marketing (8) meetup (41) mesterséges intelligencia (11) metafora (7) mobil (37) mobil keresés (17) Neticle (8) NLP meetup (17) Nuance (9) nyelv (6) nyelvészet (28) nyelvtechnológia (73) open data (11) open knowledge (7) orosz (6) Pennebaker (6) politikai blogok (22) Precognox (46) Precognox Labs (14) Python (13) R (19) spam (6) statisztika (11) számítógépes nyelvészet (8) szemantikus keresés (18) szemantikus kereső (9) szentimentelemzés (34) szövegbányászat (15) társadalomtudomány (7) tartalomelemzés (54) tartalomjegyzék (6) tematikus kereső (19) topik modellek (6) Twitter (18) twitter (15) vertikális kereső (9) vizualizáció (12) yahoo (26) Címkefelhő

A blog tartalmai CC licenc alá tartoznak

Creative Commons License
Kereső Világ by Precognox Kft. is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://kereses.blog.hu/.
Permissions beyond the scope of this license may be available at http://precognox.com/.

A Kereső Világ blogon közölt tartalmak a Precognox Kft. tulajdonát képezik. A tartalom újraközléséhez, amennyiben nem kereskedelmi céllal történik, külön engedély nem szükséges, ha linkeled az eredeti tartalmat és feltünteted a tulajdonos nevét is (valahogy így: Ez az írás a Precognox Kft. Kereső Világ blogján jelent meg). Minden más esetben fordulj hozzánk, a zoltan.varju(kukac)precognox.com címre írt levéllel.

Creative Commons License

Nevezd meg! - Ne add el! - Ne változtasd!

 

Áprilisban ezeken a rendezvényeken találkozhatsz velünk

2018.03.27. 08:58 Szerző: zoltanvarju Címkék: AI ELTE TÁTK Precognox hackathon K-Monitor Startup Safary

Itt a tavasz, jönnek a rendezvények! Előadunk, szerveztünk egy beszélgetést az AI-ról és hackathon is lesz!

hackathon_a4_v6.jpg

Április 19-én a Startup Safary-n két rendezvényt is ajánlunk nektek:

Április 20-án lehet pihenni, 21-én viszont az ELTE TÁTK, a K-Monitor és a Precognox szervezte hackathonon civiles adatokat fogunk elemezni. Reméljük sokan eljöttök!

 

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Megmondjuk ki válaszol szépen a Járókelő bejelentéseire

2018.03.07. 11:03 Szerző: zoltanvarju Címkék: gépi tanulás AI klasszifikáció Precognox Járókelő

A Járókelőn a bejelentésekre adott válaszokat egy Megoldópontszám értékeli. Az értékelés mögött egy általunk fejlesztett klasszifikációs API rejlik, amit mi nagyon megszerettünk, mert a modellhez szükséges tanulóadatok annotálásától a végső webes szolgáltatás kialakításáig végigszöszmötölhettünk a feladaton (amiről itt olvashatsz egy rövid összefoglalót).

jarokelok_hu_bejelentes_plakat.png

A Megoldópontszám a bejelentésekre adott válaszoknál jelenik meg diszkréten, ezért ki is emeltük az alábbi képen.

jarokelo.png

Tavaly egy meetupunkon bemutattuk, hogyan készítettük el a modellt, akit érdekelnek a részletek, tekerje végig a diákat.

Ebből a posztból pedig kiderül hogy mit tehetünk, ha kevés adatunk van, de nagyon szeretnénk klasszifikálni. Mert mindenkinek jár egy klasszifikáló API, azoknak is, akiknek nincs sok adatuk!

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Könyvajánló: Machines of Loving Grace - The Quest for Common Ground Between Humans and Robots

2018.02.19. 13:06 Szerző: zoltanvarju Címkék: könyvajánló mesterséges intelligencia gépi tanulás AI hci IA

Ha csak egy könyvet olvasol el a mesterséges intelligencia történetéről és jövőjéről, ez legyen az - minden túlzás nélkül lehetne ez ennek a posztnak a klikkvadász címe.

richardbrautiganpoem.jpg

John Markoff nagyon alapos munkát végzett, amikor feltérképezte a mesterséges intelligencia történetét. Nem csak kutatók, de cégalapítók és befektetők történetei színesítik a sztorit, aminek két főhőse van; Marvin Minsky és Terry Winograd. A két főszereplő együtt kezdte meg a klasszikus mesterséges intelligencia alapjainak lefektetését, de Winograd egy idő után inkább a ma Human-Computer Interaction-nek nevezett területet találta ki és elfordult mesterétől. A két szaktekintély köré szerveződött az AI (Artificial Intelligence) és a IA (Intelligent Augmentation) hívők köre, főleg a mesterek tanítványaiból, de gyakran esett meg, hogy valaki egyik hitről a másikra tért át. A két szemlélet nagyon eltérő, még az egyik leváltaná az embert, a másik inkább kiterjesztené, amikor az egyik éppen divatos, a másik terület szendereg. De most valami megváltozott és összeértek a szállak, pl. a Google Human-Centered Machine Learning-ről beszél, az IDEO pedig gépi tanulással foglalkozó céget vásárolt fel.markoff.jpg

A kötet tele van sztorikkal különböző kutatóintézetek és startupok alapításáról, a két nagy öreg pedig tanítványain keresztül folyamatosan jelen van. A legérdekesebb rész azonban az, hogy Wingorad Stanfordba érkezve hogyan vált át a AI-ról Hubert Dreyfus és John Searle filozófiai körének látogatása során az IA-ra.  Ha valaki szerint az öncélú gondolkodás haszontalan, akkor eláruljuk neki hogy Winograd két tanítványa alkotta meg a PageRank algoritmust, amire aztán az egész Google épült.

 

Aki tudni szeretné, hogyan indult a mesterséges intelligencia, miért csak most lettek menők a neurális hálók és hányszor vérzett már el a kutatási eredmények piacosítása, az feltétlenül olvassa el a könyvet! Az első fordítógépektől az önvezető autókig tényleg minden releváns technológia születését és piacra lépését olvasmányosan összefoglalta a szerző. Habár dramaturgiailag jó felütés az AI és az IA szembeállítása, a sztori közben azért rájövünk hogy nem minden fekete vagy fehér, de ez így van rendjén.

John Markoff: Machines of Loving Grace - The Quest for Common Ground Between Humans and Robots, HarperCollins, 2015

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Könyvajánló: Weapons of Math Destruction - How Big Data Increases Inequality and Threatens Democracy

2018.02.13. 14:56 Szerző: zoltanvarju Címkék: etika könyvajánló wmd big data Sandel ONeil

A szolucionizmus híveinek kötelező olvasmány Cathy O'Neil, a mathbabe blog szerzőjének könyve! Egy hajdani quant (pénzügyi geek) matek PhD-val a zsebében fogta magát és utána járt, mit köszönhetünk a gépi tanulásnak - nem sok jót talált, de arról rendkívül olvasmányos módon számol be nekünk.

weaponsmath-r4-6-06.jpg

A könyv alapvetése az, hogy a gépi tanulás hibázik és ezek a hibák hatással vannak az életünkre. Nincsenek jó modellek és ha nincs visszacsatolás, akkor nem is lesznek soha. A WMD, azaz a Weapon of Math Destruction mindig úgy indul, hogy valaki azt hiszi sok adata van, de gyakran nem tudjuk azt mérni, amit igazán szeretnénk, ezért proxikat, indikátorokat használunk. A felsőoktatási rangsorok például a tanár-diák arányt, a túljelentkezés mértékét, az átlagos felvételi pontszámot, stb. mérik, amik jó közelítőknek tűnnek, de egyben azt eredményezik, hogy minden iskola ezekre kezd rágyúrni, ezáltal a szakadék elkezd nőni az elit egyetemek és a többi között. Az objektívnek tűnő mérőszámokhoz kezdenek igazodni az iskolák, emiatt pedig egyre inkább hasonlítani kezdenek egymásra. O'Neil szerint az egyetemi rangsorok a WMD-k iskolapéldái. A könyv tíz fejezete hasonlóan működő WMD-ket mutat be az online hirdetések világával kezdve, amely kíméletlenül nyomul a szegények pénzére mindenféle hiteleket rájuk tukmálva. A munka világa két fejeztet is kap, az automatikus CV elemzés és az alkalmassági tesztek is durvák, de igazán a clopening, azaz az üzlet éjszakai zárását, majd reggeli nyitását magában foglaló műszakok, illetve a naponta többször is megszakított, algoritmikusan tervezett műszakok bemutatása során nyílik ki a bicska az ember zsebében. A biztosítási- és hitelpiac bemutatása ezek után már üdítően hat, no persze nem az hogy minden adatunkra rá szeretnék tenni a kezüket a pénzügyi cégek, de itt visszatérünk a klasszikus WMD-khez, melyek arra vannak optimalizálva, hogy a többséggel tartsanak és az átlagtól eltérőket (kisebbségek, szegények, stb.) kockázatosnak ítéljék meg. Az utolsó fejezetben összeér minden, hiszen a modern tömegdemokráciákban egyre divatosabb a célzott marketing, mely célja az átfordítható választól elérése. O'Neil szerint a már meggyőzött szavazókat elég megtartani, az ingadozókra kell összpontosítani és a célzott marketingnek hála minden csoport más ígérettel bombázható, innen egyenes út vezet a polarizálódáshoz.

 

Habár nagyon izgalmas és alapos a könyv, kicsit szájbarágós a WMD-k hatásai kapcsán. A szerző minden esetben kinyilatkoztatja  (amúgy számunkra szimpatikus) nézeteit arról, hogyan is kellene kinéznie egy ideális világnak. Ez azért furcsa, mert ezt a könyvet gyakran ajánlják a Big Data kapcsán etikai kurzusokhoz. De az aki annál többet akar látni, hogy a piaci mechanizmusok nem uralhatnak mindent és rossz dolog növelni az egyenlőtlenségeket, máshová kell fordulnia. Problémafelvetésnek remek a kötet, de talán jobban jár az érdeklődő olvasó, ha saját maga gondolkodik el a következtetéseken. Ehhez Michael Sandel Justice kurzusa online elérhető ingyen, a kapcsolódó könyv pedig magyar fordításban is beszerezhető. Ha pedig arról is el akar valaki gondolkodni, hogy meddig terjedhet a gazdasági gondolkodás, a pénz hatalma meddig érhet, annak Sandel What Money Can't Buy című könyvét ajánljuk. Vigyázat, ezek a könyvek nem adnak kész válaszokat, arra próbálják rávenni az embert hogy gondolkozzon, beszélgessen és önállóan alkosson véleményt.

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre

Emberközpontú gépi tanulás @ Entrepreneur DNA

2018.02.08. 15:38 Szerző: zoltanvarju Címkék: konferencia gépi tanulás TAS Járókelő human centered machine learning Sales Lead Generator Data Collector

Ma az Entrepreneur DNA konferencián adunk elő, kapcsolódó diáink alább.

A gépi tanulás kapcsán termékeinkről fogunk beszélni, azaz a TAS, a Data Collector, a Classifier API és a Sales Lead Generator is bemutatásra kerül.

screenshot_from_2018-02-07_14-50-57.png

A Kereső Világ a Precognox Precognox szakmai blogja A Precognox intelligens, nyelvészeti alapokra építő keresési, szövegbányászati és big data megoldások fejlesztője.

Szólj hozzá! • Kövess Facebookon • Iratkozz fel értesítőre