Gaia

XSLaren edukia

Hizketaren Teknologiak

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Gaztelania

Irakasgaiaren azalpena eta testuingurua

Ikasgaia hizkera teknologietarako sarrera da eta helburua ikasleari arlo honetan lan egiteko gaitasuna ematea da. Telekomunikazio Ingeniaritza graduan ikasitako seinalea prozesatzeko oinarriak erabiltzen dira. Graduan Multimedia Seinale Prozesaketa ikasgaian audio eta ahots seinaleak prozesatzeko oinarrizko teknikak ikusten dira eta ikasgai honetan sakontasun handiagoarekin ikasiko dira. Gainera, ikasgaia ondo jarraitzeko masterreko lehen kurtsoan Seinale Tratamendu Aurreratuan ikasten den seinale prozesaketa estatistiko aurreratua behar da.

Osasun egoerak aurrez aurreko irakaskuntza edota ebaluazioa eragotziz gero, onlineko jarduerara joko da eta ikasleei aldaketa horren berri emango zaie unean-unean.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
NAVAS CORDON, EVAEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebakarraSeinalearen Teoria eta Komunikazioakeva.navas@ehu.eus

Gaitasunak

IzenaPisua
Conocer e interpretar los procesos de generación y percepción de la voz humana.25.0 %
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz25.0 %
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de codificación de la señal de voz, manejando las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista25.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala22.533.856.2
Laborategiko p.22.533.856.2

Irakaskuntza motak

IzenaOrduakIkasgelako orduen ehunekoa
Eskola magistralak56.2540 %
Laborategiko praktikak56.2540 %

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Idatzizko azterketa30.0 % 70.0 %
Lan praktikoak30.0 % 70.0 %

Irakasgaia ikastean lortuko diren emaitzak

Ahots-seinalea sortzeko eta hautemateko prozesuak deskribatzea.

Ahots-seinalearen denbora eta maiztasun-irudikapenari eta hura aztertzeko erabiltzen diren teknikei buruzko ezagutza erakustea.

Ahots-seinalearen modelatze akustikoarekin, hizketa, hiztuna automatikoki ezagutzeko sistemekin eta ahots-sintesia eta horiek ebaluatzeko erabiltzen diren teknikekin zerikusia duten arazoak ulertzea.

Ahots seinalearen parametro nagusiak neurtu eta interpretatzea.

Pertzepziozko ahots-kodetzaile bat ezartzea.

Hizketa ezagutzeko oinarrizko sistema garatzea.

Ohiko deialdia: orientazioak eta uko egitea

Ebaluazio-sistema hiru bloke banadutan banatuta dago: zati magistrala, laborategia eta elkarlanean egindako lan praktiko bat.

- Zati magistrala 20 aukera anitzeko galderaz osatutako banakako proba batekin ebaluatzen da (%40).

- Laborategi praktikak txosten eta laborategian garatutako lanaren arabera ebaluatuko dira (%45).

- Elkarlanean egindako lana talde notarekin ebaluatuko da, lanaren garapena eta aurkezpena kontutan hartuz (%15).



Ohizko deialdian azken proba gainditu behar da 10etik 4 puntuazioarekin gutxienez eta ikasgaia gainditzeko nota finala 10etik 5 baino altuagoa izan behar da behin hiru zatietan lortutako nota guztiak batuta. Hiru zatiak independenteak dira eta behin zati bat gainditzen denean gordetzen da hurrengo deialdientzako.



Ebaluazio mistoa jarraitu ezin duten ikasleek idatziz justifikatu beharko dute hala ez egiteko arrazoiak (graduko ikasketen gestiorako arautegia egokituz). Kurtsoko lehenengo bi asteetan irakasleei aurkeztu behar diete dokumentua eta baita eskolako zuzendaritzari ere, azterketan hasi baino hilabete bat lehenago behintzat. Hauek irakasgaia menperatzen dutela frogatu behar dute ebaluaketa finalarekin. Ebaluaketa hau hiru zatiz osatuta izango da: azterketa idatzita (%40), laborategiko azterketa (%45) eta lanaren aurkezpena (%15).



Ikasle bat ez bada azterketara etortzen deialdiari uko egiten diola ulertuko da.



Osasun egoerak aurrez aurreko irakaskuntza edota ebaluazioa eragotziz gero, onlineko jarduerara joko da eta ikasleei aldaketa horren berri emango zaie.

Ezohiko deialdia: orientazioak eta uko egitea

Ez-ohizko deialdian bi proba egingo dira: azterketa bat bloke magistralarekin lotuta eta beste proba laborategi praktikekin lotuta. Proba bakoitzak nota finalaren %50 balioa izango du eta biak gutxieneko 10etik 5 notarekin gainditu behar dira.



Ebaluazio mistoan parte ez hartzeko justifikatzeko idatzia aurkeztu duten ikasleek praktikak ondo egin dituztela egiaztatu beharko dute.



Osasun egoerak aurrez aurreko irakaskuntza edota ebaluazioa eragotziz gero, onlineko jarduerara joko da eta ikasleei aldaketa horren berri emango zaie.

Irakasgai-zerrenda

1. Gaia Sarrera hizketa teknologietara

2. Gaia Ahots seinale sorkuntza eta pertzepzioa

3. Gaia Ahots seinalea prozesatzeko teknika aurreratuak

4. Gaia Ahots kodeketa

5. Gaia Ahots eta hizlariak ezagutzeko teknikak

6. Gaia Testu ahots bihurketa

Bibliografia

Nahitaez erabili beharreko materiala

Ikasleek eGelan (http://egela.ehu.eus/) honako materialak izango dituzte eskuragai:



- Gardenkiak ikasgai eduki teorikoarekin.



- Praktiken gidoiak, praktika bakoitzeko dokumentu bat sarrera teorikoa barne.



- Beharrezko seinaleak, Matlab programak, Linux script-ak eta praktika garatzeko beste beharrezko tresnak.



- Taldeko lana nola egiteko azaltzen duen dokumentua.



Oinarrizko bibliografia

- J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms and

applications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)

- L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978.

(ISBN: 978-0132136037)

- X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm

and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)

- A. V. Oppenheim, R. W. Schafer. Discrete-Time signal processing (3rd edition). Pearson

Prentice Hall, 2009. (ISBN: 978-0131988422)

- D. Jurafsky, J. H. Martin. Speech and Language Processing (2nd edition). Prentice Hall,

2008. (ISBN: 978-0131873216)

Gehiago sakontzeko bibliografia

- P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN:



978-0521899277)



- L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN:



978-0130151575)



- D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer,



2015. (ISBN: 978-1447157786)



- W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized



Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)



Aldizkariak

Computer Speech and Language



Speech Communication



IEEE Transactions on Audio, Speech & Language Processing



IEEE Transactions on Systems, Man and Cybernetics-Part B



IEEE Transactions on Multimedia



Journal of the Acoustical Society of America







Estekak

- Speech Technologies



http://www.speech.cs.cmu.edu/



http://festvox.org/



- Review of Speech Synthesis Technology



http://www.acoustics.hut.fi/publications/files/theses/lemmetty_mst/contents.html



- Speech Technology Hyperlinks Page



http://www.speech.cs.cmu.edu/comp.speech/Section5/speechlinks.html



- Smithsonian Speech Synthesis History Project (SSSHP)



https://amhistory.si.edu/archives/speechsynthesis/ss_home.htm



- TTS sistemak



https://www.acapela-group.com/demos/



http://www.nuance.com/landing-pages/playground/Vocalizer_Demo2/vocaLizer_modal.html?demo=true



http://www.cepstral.com/en/demos



https://cloud.google.com/text-to-speech



http://aholab.ehu.eus/tts



- ASR sistemak



https://speech-to-text-demo.ng.bluemix.net/



https://www.google.com/intl/en/chrome/demos/speech.html

XSLaren edukia

Iradokizunak eta eskaerak