Gaia
Hizketa Teknologiak
Gaiari buruzko datu orokorrak
- Modalitatea
- Ikasgelakoa
- Hizkuntza
- Ingelesa
Irakasgaiaren azalpena eta testuingurua
Irakasgaiaren helburua ikasleak ahots-seinalearen prozesamenduaren oinarrizko aplikazioekin ohitzea da, hala nola sintesiarekin eta hizketaren ezagutza automatikoarekin. Ikuspegi praktiko batetik, bi teknologietan eman diren paradigma nagusiak aztertuko dira, sistema horiek sortzeko prozedurak deskribatuko dira, eta baita beharrezkoak diren baliabideak eta ahots datu baseak sortzeko. Ikasleek sistema errealekin praktikatuko dute. Horrez gain, ahotsaren prozesamenduarekin lotutako beste aplikazio batzuk ere berrikusiko dira labur-labur, hala nola esatariaren edo emozioaren ezagutza, ahotsaren bihurketa edo diarizazioa, besteak beste.Ikasgai hau ikasteko, ikasleak mintzamena ekoizteko oinarrizko ereduak, seinalearen denborazko eta maiztasunezko analisiaren kontzeptuak eta seinaleak digitalizatzeko oinarriak ezagutu behar ditu.
Irakasleak
Izena | Erakundea | Kategoria | Doktorea | Irakaskuntza-profila | Arloa | Helbide elektronikoa |
---|---|---|---|---|---|---|
NAVAS CORDON, EVA | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebakarra | Seinalearen Teoria eta Komunikazioak | eva.navas@ehu.eus |
SARATXAGA COUCEIRO, IBON | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebiduna | Ingeniaritza Telematikoa | ibon.saratxaga@ehu.eus |
Gaitasunak
Izena | Pisua |
---|---|
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz. | 25.0 % |
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de reconocimiento de la señal de voz. | 25.0 % |
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista. | 25.0 % |
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz. | 25.0 % |
Irakaskuntza motak
Mota | Ikasgelako orduak | Ikasgelaz kanpoko orduak | Orduak guztira |
---|---|---|---|
Magistrala | 15 | 22.5 | 37.5 |
Ordenagailuko p. | 30 | 45 | 75 |
Irakaskuntza motak
Izena | Orduak | Ikasgelako orduen ehunekoa |
---|---|---|
Eskola magistralak | 37.5 | 40 % |
Ordenagailuko praktikak, irteerak, bisitak | 75.0 | 40 % |
Ebaluazio-sistemak
Izena | Gutxieneko ponderazioa | Gehieneko ponderazioa |
---|---|---|
Azalpenak | 20.0 % | 40.0 % |
Praktiken Memoria/Txostenak | 20.0 % | 50.0 % |
Test motako azterketa | 30.0 % | 60.0 % |
Irakasgaia ikastean lortuko diren emaitzak
RA1 Demostrar comprensión de los problemas relacionados con el modelado acústico de la señal de voz,RA2 Manejar herramientas de análisis y procesado de la señal de voz.
RA3 Demostrar comprensión sobre los sistemas de reconocimiento automático del habla, del hablante y de síntesis de voz, así como las técnicas utilizadas para la evaluación de los mismos.
RA4 Desarrollar un sistema básico de reconocimiento del habla.
RA5 Extraer información de un artículo científico y presentarla de forma oral a un público interdisciplinar e internacional.
Ohiko deialdia: orientazioak eta uko egitea
Ebaluazio-sistema hiru multzo independentetan banatzen da: magistrala, laborategiko praktikak eta hizketa-teknologia bati buruzko lan baten azalpena.Alderdi magistrala banakako idatzizko proba baten bidez ebaluatzen da, galdera laburretatik eta aukera anitzeko galderetatik abiatuta (% 40).
Laborategiko praktiken zatia memorien eta laborategian egindako lanaren bidez ebaluatzen da (% 40).
Lanaren azalpena jendaurreko aurkezpen batekin ebaluatzen da (% 20).
Ohiko deialdian alderdi magistraleko proba gainditu behar da 10etik 5eko gutxieneko notarekin, eta irakasgaia gainditzeko 10etik 5etik gorako amaierako nota lortu behar da kalifikazio guztiak gehitu ondoren. Ebaluazio-bloke bakoitza independentea da, eta bloke bat gainditu ondoren, nota hurrengo deialdietarako gordeko da.
UKO EGITEA:
Ebaluazio mistoa egin ezin dutenek arrazoiak justifikatu beharko dizkiote irakasle taldeari, indarrean dagoe araudian ezarritako prozedurari jarraikiz. Irakasgaiaren ikaskuntzaren emaitzak azken ebaluazio baten bidez frogatu ahal izango dituzte: idatzizko proba bat (%40 nota), laborategiko proba bat (%45 nota) eta hizketaren teknologiarekin zerikusia duen lan bat aurkeztea (%15 nota).
Pertsona bat azken proba idatzira aurkezten ez bada, ulertuko da pertsona horrek deialdi horri uko egin diola.
Ezohiko deialdia: orientazioak eta uko egitea
Aparteko deialdian bi proba eginen dira: bloke magistraleko proba bat eta laborategiko proba bat. Proba bakoitzak azken notaren% 50 izanen du eta biak gainditu beharko dira, gutienez ere 5 puntu 10etik.Ebaluazio mistoan parte hartu ez dutela frogatzen duen idazkirik aurkeztu ez duten ikasleek praktikak behar bezala egin dituztela frogatu beharko dute.
Irakasgai-zerrenda
1. Speech modelling2. Speech synthesis
3. Speech recognition
4. Other speech technologies
Bibliografia
Nahitaez erabili beharreko materiala
Apuntes de la asignatura: magistrales y prácticas.Oinarrizko bibliografia
X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)D. Jurafsky, J. H. Martin. Speech and Language Processing (2nd edition). Prentice Hall, 2008. (ISBN: 978-0131873216)
P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN: 978-0521899277)
L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN: 978-0130151575)
D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer, 2015. (ISBN: 978-1447157786)
W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)
Aldizkariak
Computer Speech and LanguageSpeech Communication
IEEE Transactions on Audio Speech and Language Processing
IEEE Transactions on Multimedia
Estekak
Página de voz en la CMU http://www.speech.cs.cmu.edu/European Languages Resources Association (ELRA) http://www.elra.info/en/catalogues/
Linguistic Data Consortium (LDC) https://www.ldc.upenn.edu/language-resources
Smithsonian Speech Synthesis History Project (SSSHP) http://www.mindspring.com/~ssshp/ssshp_cd/ss_home.htm
Síntesis de habla emocional http://emosamples.syntheticspeech.de/