Gaia

XSLaren edukia

Hizketa Teknologiak

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

El objetivo de la asignatura es que los y las estudiantes se familiaricen con las aplicaciones fundamentales del procesado de la se¿de voz, como son la s¿esis y el reconocimiento autom¿co del habla. Con un enfoque pr¿ico, se analizar¿los principales paradigmas que se han dado en ambas tecnolog¿, se describir¿los procedimientos para la generaci¿e estos sistemas con la necesaria creaci¿e recursos y BD de voz y los estudiantes practicar¿con sistemas reales. Adicionalmente se revisar¿brevemente otras aplicaciones relacionadas con el procesamiento de la voz como el reconocimiento de locutor o de la emoci¿la conversi¿e voz o la diarizaci¿ntre otras.

Para cursar esta asignatura el estudiante debe dominar los modelos b¿cos de producci¿el habla, los conceptos de an¿sis temporal y frecuencial de la se¿y los fundamentos de digitalizaci¿e se¿s.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
NAVAS CORDON, EVAEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebakarraSeinalearen Teoria eta Komunikazioakeva.navas@ehu.eus
SARATXAGA COUCEIRO, IBONEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaIngeniaritza Telematikoaibon.saratxaga@ehu.eus

Gaitasunak

IzenaPisua
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz.25.0 %
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de reconocimiento de la señal de voz.25.0 %
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista.25.0 %
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala1522.537.5
Ordenagailuko p.304575

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Azalpenak20.0 % 40.0 %
Praktiken Memoria/Txostenak20.0 % 50.0 %
Test motako azterketa30.0 % 60.0 %

Irakasgaia ikastean lortuko diren emaitzak

RA1 Demostrar comprensi¿e los problemas relacionados con el modelado ac¿stico de la se¿de voz,

RA2 Manejar herramientas de an¿sis y procesado de la se¿de voz.

RA3 Demostrar comprensi¿obre los sistemas de reconocimiento autom¿co del habla, del hablante y de s¿esis de voz, as¿omo las t¿icas utilizadas para la evaluaci¿e los mismos.

RA4 Desarrollar un sistema b¿co de reconocimiento del habla.

RA5 Extraer informaci¿e un art¿lo cient¿co y presentarla de forma oral a un p¿blico interdisciplinar e internacional.

Ohiko deialdia: orientazioak eta uko egitea

Para la evaluación del alumnado en convocatoria ordinaria se utilizarán diferentes herramientas:



- Examen escrito

Al final del curso se realizará un examen escrito. En él el alumnado deberá demostrar su dominio de los conceptos explicados en las clases magistrales y que se encuentran descritos en los apuntes proporcionados. El examen podrá contener una parte de respuesta tipo test y otra parte de desarrollo.



- Trabajos de prácticas

Las prácticas se realizarán parcialmente durante las clases presenciales. El estudiante deberá entregar obligatoriamente una memoria de las prácticas realizadas, según las indicaciones proporcionadas. Las prácticas obligatorias deberán ser entregadas en las fechas indicadas durante el curso.



- Presentación oral

Al comienzo del curso se propondrán temas que deberán ser trabajados por los estudiantes. Al finalizar el curso se realizarán presentaciones orales de dichos trabajos. Se evaluarán tanto las presentaciones realizadas como el documento descriptivo del trabajo.



Para renunciar a la convocatoria ordinaria el alumno o alumna deberá comunicarlo al profesorado de la asignatura con dos semanas de antelación a la finalización del curso.

Ezohiko deialdia: orientazioak eta uko egitea

En la convocatoria extraordinaria, el alumnado será evaluado de las mismas competencias que en la convocatoria ordinaria, para lo cual se establecen las siguientes herramientas de evaluación:



- Examen escrito que abarcará los conceptos impartidos en las clases magistrales. El examen podrá tener una parte de tipo test y otra parte de desarrollo.



- Prácticas de laboratorio: se deberán entregar obligatoriamente las memorias de las prácticas propuestas durante el curso.



- Presentación oral: Se realizará una presentación oral sobre un tema elegido por el alumno o alumna y se entregará un documento con la descripción del trabajo realizado.



Irakasgai-zerrenda

1. Speech modelling

2. Speech synthesis

3. Speech recognition

4. Other speech technologies

Bibliografia

Nahitaez erabili beharreko materiala

Apuntes de la asignatura: magistrales y pr¿icas.

Oinarrizko bibliografia

- J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms and applications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)



- L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978. (ISBN: 978-0132136037)



- X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)



- A. V. Oppenheim, R. W. Schafer. Discrete-Time signal processing (3rd edition). Pearson Prentice Hall, 2009. (ISBN: 978-0131988422)

Gehiago sakontzeko bibliografia

- P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN: 978-0521899277)







- L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN: 78-0130151575)







- D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer, 2015. (ISBN: 978-1447157786)







- W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)

Aldizkariak

Computer Speech and Language







Speech Communication







IEEE Transactions on Audio, Speech & Language Processing







IEEE Transactions on Systems, Man and Cybernetics-Part B







IEEE Transactions on Multimedia







Journal of the Acoustical Society of America

Estekak

- Speech Technologies



http://www.speech.cs.cmu.edu/ news:comp.speech http://festvox.org/



- Review of Speech Synthesis Technology



http://www.acoustics.hut.fi/publications/files/theses/lemmetty_mst/contents.html



- Speech Technology Hyperlinks Page



http://www.speech.cs.cmu.edu/comp.speech/Section5/speechlinks.html



- Demos de sistemas TTS



http://www.acapela-group.com/text-to-speech-interactive-demo.html



http://www.loquendo.com/en/demo-center/tts-demo/



http://enterprisecontent.nuance.com/vocalizer5-network-demo/index.html



http://aholab.ehu.es/tts/tts_en.html

XSLaren edukia

Ezin izan da edukia sortu, beranduago saiatu. Arazoak aurrera jarraitzen badu, jarri harremanetan CAUrekin (Tlf: 946014400 / Email: cau@ehu.eus / Web: https://lagun.ehu.eus).