Gaia

XSLaren edukia

Hizketa Teknologiak

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

Irakasgaiaren helburua ikasleak ahots-seinalearen prozesamenduaren oinarrizko aplikazioekin ohitzea da, hala nola sintesiarekin eta hizketaren ezagutza automatikoarekin. Ikuspegi praktiko batetik, bi teknologietan eman diren paradigma nagusiak aztertuko dira, sistema horiek sortzeko prozedurak deskribatuko dira, eta baita beharrezkoak diren baliabideak eta ahots datu baseak sortzeko. Ikasleek sistema errealekin praktikatuko dute. Horrez gain, ahotsaren prozesamenduarekin lotutako beste aplikazio batzuk ere berrikusiko dira labur-labur, hala nola esatariaren edo emozioaren ezagutza, ahotsaren bihurketa edo diarizazioa, besteak beste.

Ikasgai hau ikasteko, ikasleak mintzamena ekoizteko oinarrizko ereduak, seinalearen denborazko eta maiztasunezko analisiaren kontzeptuak eta seinaleak digitalizatzeko oinarriak ezagutu behar ditu.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
NAVAS CORDON, EVAEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebakarraSeinalearen Teoria eta Komunikazioakeva.navas@ehu.eus
SARATXAGA COUCEIRO, IBONEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaIngeniaritza Telematikoaibon.saratxaga@ehu.eus

Gaitasunak

IzenaPisua
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz.25.0 %
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de reconocimiento de la señal de voz.25.0 %
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista.25.0 %
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala1522.537.5
Ordenagailuko p.304575

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Azalpenak20.0 % 40.0 %
Praktiken Memoria/Txostenak20.0 % 50.0 %
Test motako azterketa30.0 % 60.0 %

Irakasgaia ikastean lortuko diren emaitzak

RA1 Ahots-seinalearen modelatze akustikoarekin lotutako arazoak ulertzea.

RA2 Ahots-seinalea aztertzeko eta prozesatzeko tresnak erabiltzea.

RA3 Ahots sintesi sistemak eta mintzamena eta hiztuna automatikoki ezagutzeko sistemak ulertzea, baita horiek ebaluatzeko erabiltzen diren teknikak ere.

RA4 Hizketa ezagutzeko oinarrizko sistema garatzea.

RA5 Artikulu zientifiko batetik informazioa ateratzea eta ahoz aurkeztea diziplina arteko eta nazioarteko publikoari.

Ohiko deialdia: orientazioak eta uko egitea

Ebaluazio-sistema hiru multzo independentetan banatzen da: magistrala, laborategiko praktikak eta hizketa-teknologia bati buruzko lan baten azalpena.

Alderdi magistrala banakako idatzizko proba baten bidez ebaluatzen da, galdera laburretatik eta aukera anitzeko galderetatik abiatuta (% 40).

Laborategiko praktiken zatia memorien eta laborategian egindako lanaren bidez ebaluatzen da (% 40).

Lanaren azalpena jendaurreko aurkezpen batekin ebaluatzen da (% 20).

Ohiko deialdian alderdi magistraleko proba gainditu behar da 10etik 3ko gutxieneko notarekin, eta irakasgaia gainditzeko 10etik 5etik gorako amaierako nota lortu behar da kalifikazio guztiak gehitu ondoren. Ebaluazio-bloke bakoitza independentea da, eta bloke bat gainditu ondoren, nota hurrengo ezohiko deialdirako gordeko da.

UKO EGITEA:

Ebaluazio mistoa egin ezin dutenek arrazoiak justifikatu beharko dizkiote irakasle taldeari, indarrean dagoe araudian ezarritako prozedurari jarraikiz. Irakasgaiaren ikaskuntzaren emaitzak azken ebaluazio baten bidez frogatu ahal izango dituzte: idatzizko proba bat (%40 nota), laborategiko proba bat (%45 nota) eta hizketaren teknologiarekin zerikusia duen lan bat aurkeztea (%15 nota).

Pertsona bat azken proba idatzira aurkezten ez bada, ulertuko da pertsona horrek deialdi horri uko egin diola.

Ezohiko deialdia: orientazioak eta uko egitea

Aparteko deialdian bi proba eginen dira: bloke magistraleko proba bat eta laborategiko proba bat. Proba bakoitzak azken notaren% 50 izanen du eta bloke magistraleko proba gainditu behar da 10etik 3ko gutxieneko notarekin.

Irakasgai-zerrenda

1. Ahots-modelatzea

2. Hizketa sintesia

3. Hizketa ezagupena

4. Beste hizketa teknologiak

Bibliografia

Nahitaez erabili beharreko materiala

Irakasgaiaren apunteak: magistralak eta praktikak.

Oinarrizko bibliografia

- J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms and applications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)



- L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978. (ISBN: 978-0132136037)



- X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)



- A. V. Oppenheim, R. W. Schafer. Discrete-Time signal processing (3rd edition). Pearson Prentice Hall, 2009. (ISBN: 978-0131988422)

Gehiago sakontzeko bibliografia

- P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN: 978-0521899277)







- L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN: 78-0130151575)







- D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer, 2015. (ISBN: 978-1447157786)







- W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)

Aldizkariak

Computer Speech and Language







Speech Communication







IEEE Transactions on Audio, Speech & Language Processing







IEEE Transactions on Systems, Man and Cybernetics-Part B







IEEE Transactions on Multimedia







Journal of the Acoustical Society of America

Estekak

- Speech Technologies



http://www.speech.cs.cmu.edu/ news:comp.speech http://festvox.org/



- Review of Speech Synthesis Technology



http://www.acoustics.hut.fi/publications/files/theses/lemmetty_mst/contents.html



- Speech Technology Hyperlinks Page



http://www.speech.cs.cmu.edu/comp.speech/Section5/speechlinks.html



- Demos de sistemas TTS



http://www.acapela-group.com/text-to-speech-interactive-demo.html



http://www.loquendo.com/en/demo-center/tts-demo/



http://enterprisecontent.nuance.com/vocalizer5-network-demo/index.html



http://aholab.ehu.es/tts/tts_en.html

XSLaren edukia

Ezin izan da edukia sortu, beranduago saiatu. Arazoak aurrera jarraitzen badu, jarri harremanetan CAUrekin (Tlf: 946014400 / Email: cau@ehu.eus / Web: https://lagun.ehu.eus).