Szegedi Tudományegyetem, Természettudományi és Informatikai Kar, Informatikai Tanszékcsoport

www.inf.u-szeged.hu/hlt

Nyelv- és beszédtechnológiához kapcsolódó tevékenységei
beszédfelismerés
▪ beszédfelismerés rejtett Markov-modellekkel
▪ izolált szavas és folyamatos beszédfelismerés
▪ diktálórendszerek
▪ orvosi diktálórendszer
▪ előfeldolgozási technológiák
▪ beszélőadaptáció,
▪ beszélőnormalizálás
▪ beszédfelismeréses neuronhálós technológiákkal, hibrid és tandem architektúrában.
▪ beszédjavítás-terápiai segédprogramok (Beszédmester)

szövegfeldolgozás
▪ nyelvi erőforrások, referencia adatbázisok készítése
▪ korpuszok gyűjtése és feldolgozása különböző szempontok alapján wordnetépítés (fogalomhálók alkalmazásai)
▪  szegmentálás (bekezdés-, mondat-, és tokenhatárok felismerése különböző európai nyelveken)
▪ tulajdonnevek és speciális tokenek felismerése és osztályozása (nyelvfüggetlen módon, reguláris kifejezések és szótárak segítségével)
▪ szófaji elemzés és egyértelműsítés (kivételszótárak, nyílt forráskódú rendszerek adaptációja, az egyértelműsítésre HMM bi-gram, tri-gram egyértelműsítők, hibrid (szabály- és valószínűségi alapú], illetve heurisztikus algoritmusok)
▪ szintaktikai elemzés (tanuló algoritmusok, szabály alapú, formális nyelvek, attribútum nyelvtanokon alapuló módszerek)
▪ szemantikai egyértelműsítés (word-sense disambiguation heurisztikus és tanuló algoritmusokkal)
▪ információkinyerés (szemantikus keretek segítségével, a szemantikus keretmodell általánosításai)

Kutatásban betöltött szerepe
Az informatikai tanszékcsoport a számítástudomány sok ágában végez kutatásokat: elméleti számítástudomány, formális nyelvek és automaták, optimalizálás, szoftver karbantartás, elemzés, metrikák, és ezen kívül számítógépes nyelvészeti kutatásokat is végez.

A kutatásokat jelentős részben a Mesterséges Intelligencia Kutató Csoportban dolgozók végzik. Ennek a kutató csoportnak ez az egyik fő tevékenysége. Rajtuk kívül néhány más tanszék dolgozói alkotják a nyelvtechnológiai csoportot.

A nyelvtechnológiai csoport 1999 óta fejti ki tevékenységét és katalizálja, segíti a nyelvtechnológiai fejlesztéseket, vesz részt K+F projektekben.

Oktatásban betöltött szerepe
▪ gazdasági informatikus Bsc. (Msc. akkreditáció folyamatban van)
▪ mérnök informatikus Bsc. (Msc. akkreditáció folyamatban van)
▪ programtervező informatikus Bsc. és Msc.
▪ informatika tanár Bsc. és Msc. másodszak

Évente kb. 5-600 új nappali és 50-100 levelező szakos informatikus hallgató kezdi meg tanulmányait a tanszékcsoport által vezetett kurzusokon.

A szervezet nem-piaci tevékenysége
▪ MTBA Magyar Telefonbeszéd-Adatbázis
▪ MRBA Magyar Referencia Beszédadatbázis
▪ Szeged Treebank egyik szerzője - ingyenes oktatási és kutatási célokra
▪ Magyar tulajdonnévi korpusz (NER) - ingyenes
▪ Magyar wordnet BCS - ingyenes lesz oktatási és kutatási célokra

Jelentősebb pályázatok, szerződéses munkák 2005 óta
▪ NKFP 6/074/2005 - Nemzeti és etnikai identitás vizsgálata történelmi eseményekre vonatkozó szövegek narratív alakzatainak számítógépes tartalomelemzése révén
▪ NKFP Jedlik Ányos 2007, TUDORKA7 - Hatékony tudásmenedzsment eszköz kialakítása nyelvészeti és gráfelméleti eszközök integrációjával a hazai és közösségi vámhatóságok részére
▪ NKFP Jedlik Ányos 2007, TEXTREND - Automatikus trendelemzés a világhálóról származó szöveges információforrások alapján tudományos és gazdasági alkalmazásokkal.

Dolgozóinak száma: 50 fő
PhD hallgatók száma: 20 fő