Gaia
Hizketaren Teknologiak
Gaiari buruzko datu orokorrak
- Modalitatea
- Ikasgelakoa
- Hizkuntza
- Gaztelania
Irakasgaiaren azalpena eta testuingurua
Ikasgaia hizkera teknologietarako sarrera da eta helburua ikasleari arlo honetan lan egiteko gaitasuna ematea da. Telekomunikazio Ingeniaritza graduan ikasitako seinalea prozesatzeko oinarriak erabiltzen dira. Graduan Multimedia Seinale Prozesaketa ikasgaian audio eta ahots seinaleak prozesatzeko oinarrizko teknikak ikusten dira eta ikasgai honetan sakontasun handiagoarekin ikasiko dira. Gainera, ikasgaia ondo jarraitzeko masterreko lehen kurtsoan Seinale Tratamendu Aurreratuan ikasten den seinale prozesaketa estatistiko aurreratua behar da.Osasun egoerak aurrez aurreko irakaskuntza edota ebaluazioa eragotziz gero, onlineko jarduerara joko da eta ikasleei aldaketa horren berri emango zaie unean-unean.
Irakasleak
Izena | Erakundea | Kategoria | Doktorea | Irakaskuntza-profila | Arloa | Helbide elektronikoa |
---|---|---|---|---|---|---|
NAVAS CORDON, EVA | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebakarra | Seinalearen Teoria eta Komunikazioak | eva.navas@ehu.eus |
Gaitasunak
Izena | Pisua |
---|---|
Conocer e interpretar los procesos de generación y percepción de la voz humana. | 25.0 % |
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz | 25.0 % |
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de codificación de la señal de voz, manejando las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz. | 25.0 % |
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista | 25.0 % |
Irakaskuntza motak
Mota | Ikasgelako orduak | Ikasgelaz kanpoko orduak | Orduak guztira |
---|---|---|---|
Magistrala | 22.5 | 33.8 | 56.2 |
Laborategiko p. | 22.5 | 33.8 | 56.2 |
Irakaskuntza motak
Izena | Orduak | Ikasgelako orduen ehunekoa |
---|---|---|
Eskola magistralak | 56.25 | 40 % |
Laborategiko praktikak | 56.25 | 40 % |
Ebaluazio-sistemak
Izena | Gutxieneko ponderazioa | Gehieneko ponderazioa |
---|---|---|
Idatzizko azterketa | 30.0 % | 70.0 % |
Lan praktikoak | 30.0 % | 70.0 % |
Irakasgaia ikastean lortuko diren emaitzak
Ahots-seinalea sortzeko eta hautemateko prozesuak deskribatzea.Ahots-seinalearen denbora eta maiztasun-irudikapenari eta hura aztertzeko erabiltzen diren teknikei buruzko ezagutza erakustea.
Ahots-seinalearen modelatze akustikoarekin, hizketa, hiztuna automatikoki ezagutzeko sistemekin eta ahots-sintesia eta horiek ebaluatzeko erabiltzen diren teknikekin zerikusia duten arazoak ulertzea.
Ahots seinalearen parametro nagusiak neurtu eta interpretatzea.
Pertzepziozko ahots-kodetzaile bat ezartzea.
Hizketa ezagutzeko oinarrizko sistema garatzea.
Ohiko deialdia: orientazioak eta uko egitea
Ebaluazio-sistema hiru bloke banadutan banatuta dago: zati magistrala, laborategia eta elkarlanean egindako lan praktiko bat.- Zati magistrala 20 aukera anitzeko galderaz osatutako banakako proba batekin ebaluatzen da (%40).
- Laborategi praktikak txosten eta laborategian garatutako lanaren arabera ebaluatuko dira (%45).
- Elkarlanean egindako lana talde notarekin ebaluatuko da, lanaren garapena eta aurkezpena kontutan hartuz (%15).
Ohizko deialdian azken proba gainditu behar da 10etik 4 puntuazioarekin gutxienez eta ikasgaia gainditzeko nota finala 10etik 5 baino altuagoa izan behar da behin hiru zatietan lortutako nota guztiak batuta. Hiru zatiak independenteak dira eta behin zati bat gainditzen denean gordetzen da hurrengo deialdientzako.
Ebaluazio mistoa jarraitu ezin duten ikasleek idatziz justifikatu beharko dute hala ez egiteko arrazoiak (graduko ikasketen gestiorako arautegia egokituz). Kurtsoko lehenengo bi asteetan irakasleei aurkeztu behar diete dokumentua eta baita eskolako zuzendaritzari ere, azterketan hasi baino hilabete bat lehenago behintzat. Hauek irakasgaia menperatzen dutela frogatu behar dute ebaluaketa finalarekin. Ebaluaketa hau hiru zatiz osatuta izango da: azterketa idatzita (%40), laborategiko azterketa (%45) eta lanaren aurkezpena (%15).
Ikasle bat ez bada azterketara etortzen deialdiari uko egiten diola ulertuko da.
Osasun egoerak aurrez aurreko irakaskuntza edota ebaluazioa eragotziz gero, onlineko jarduerara joko da eta ikasleei aldaketa horren berri emango zaie.
Ezohiko deialdia: orientazioak eta uko egitea
Ez-ohizko deialdian bi proba egingo dira: azterketa bat bloke magistralarekin lotuta eta beste proba laborategi praktikekin lotuta. Proba bakoitzak nota finalaren %50 balioa izango du eta biak gutxieneko 10etik 5 notarekin gainditu behar dira.Ebaluazio mistoan parte ez hartzeko justifikatzeko idatzia aurkeztu duten ikasleek praktikak ondo egin dituztela egiaztatu beharko dute.
Osasun egoerak aurrez aurreko irakaskuntza edota ebaluazioa eragotziz gero, onlineko jarduerara joko da eta ikasleei aldaketa horren berri emango zaie.
Irakasgai-zerrenda
1. Gaia Sarrera hizketa teknologietara2. Gaia Ahots seinale sorkuntza eta pertzepzioa
3. Gaia Ahots seinalea prozesatzeko teknika aurreratuak
4. Gaia Ahots kodeketa
5. Gaia Ahots eta hizlariak ezagutzeko teknikak
6. Gaia Testu ahots bihurketa
Bibliografia
Nahitaez erabili beharreko materiala
Ikasleek eGelan (http://egela.ehu.eus/) honako materialak izango dituzte eskuragai:- Gardenkiak ikasgai eduki teorikoarekin.
- Praktiken gidoiak, praktika bakoitzeko dokumentu bat sarrera teorikoa barne.
- Beharrezko seinaleak, Matlab programak, Linux script-ak eta praktika garatzeko beste beharrezko tresnak.
- Taldeko lana nola egiteko azaltzen duen dokumentua.
Oinarrizko bibliografia
- J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms andapplications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)
- L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978.
(ISBN: 978-0132136037)
- X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm
and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)
- A. V. Oppenheim, R. W. Schafer. Discrete-Time signal processing (3rd edition). Pearson
Prentice Hall, 2009. (ISBN: 978-0131988422)
- D. Jurafsky, J. H. Martin. Speech and Language Processing (2nd edition). Prentice Hall,
2008. (ISBN: 978-0131873216)
Gehiago sakontzeko bibliografia
- P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN:978-0521899277)
- L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN:
978-0130151575)
- D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer,
2015. (ISBN: 978-1447157786)
- W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized
Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)
Aldizkariak
Computer Speech and LanguageSpeech Communication
IEEE Transactions on Audio, Speech & Language Processing
IEEE Transactions on Systems, Man and Cybernetics-Part B
IEEE Transactions on Multimedia
Journal of the Acoustical Society of America
Estekak
- Speech Technologieshttp://www.speech.cs.cmu.edu/
http://festvox.org/
- Review of Speech Synthesis Technology
http://www.acoustics.hut.fi/publications/files/theses/lemmetty_mst/contents.html
- Speech Technology Hyperlinks Page
http://www.speech.cs.cmu.edu/comp.speech/Section5/speechlinks.html
- Smithsonian Speech Synthesis History Project (SSSHP)
https://amhistory.si.edu/archives/speechsynthesis/ss_home.htm
- TTS sistemak
https://www.acapela-group.com/demos/
http://www.nuance.com/landing-pages/playground/Vocalizer_Demo2/vocaLizer_modal.html?demo=true
http://www.cepstral.com/en/demos
https://cloud.google.com/text-to-speech
http://aholab.ehu.eus/tts
- ASR sistemak
https://speech-to-text-demo.ng.bluemix.net/
https://www.google.com/intl/en/chrome/demos/speech.html