Materia

Contenido de XSL

Tratamiento del Habla

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

El objetivo de la asignatura es que los y las estudiantes se familiaricen con la señal de voz así como con las técnicas básicas que se utilizan para su análisis y procesamiento. Para ello se describen los fundamentos de la producción del habla humana y de su percepción por el oído humano, para continuar con la definición de las técnicas básicas del procesamiento de señal de voz. El curso incluye numerosos ejercicios y prácticas para que alumnado trabaje con estos conceptos.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
HERNAEZ RIOJA, INMACULADA CONCEPCIONUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado Catedratico De UniversidadDoctoraNo bilingüeTeoría de la Señal y Comunicacionesinma.hernaez@ehu.eus
SARATXAGA COUCEIRO, IBONUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctorBilingüeIngeniería Telemáticaibon.saratxaga@ehu.eus

Competencias

DenominaciónPeso
Conocer e interpretar los procesos de generación y percepción de la voz humana.25.0 %
Analizar y explicar el análisis temporal y espectral de señales de voz.25.0 %
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz.25.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral1522.537.5
P. Ordenador304575

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Examen tipo test40.0 % 70.0 %
Informes/Memoria de Prácticas30.0 % 60.0 %

Resultados del aprendizaje de la asignatura

• RA1 Describir los procesos de generación y percepción de la señal de voz.

• RA2 Demostrar conocimientos sobre la representación temporal y frecuencial de la señal de voz y sobre las técnicas empleadas para su análisis.

• RA3 Medir e interpretar los principales parámetros que caracterizan la señal de voz.

• RA4 Manejar herramientas de análisis y procesado de la señal de voz.

Convocatoria ordinaria: orientaciones y renuncia

Para la evaluación del alumnado en convocatoria ordinaria se utilizarán las siguientes herramientas:



- Examen escrito



Al final del curso se realizará un examen escrito. En él el alumnado deberá demostrar su dominio de los conceptos explicados en las clases magistrales y que se encuentran descritos en los apuntes proporcionados.



- Trabajos de prácticas

Las prácticas se realizarán parcialmente durante las clases presenciales. El alumno deberá entregar obligatoriamente una memoria de las prácticas realizadas, según las indicaciones proporcionadas. Las prácticas deberán ser entregadas en las fechas indicadas durante el curso.



Para renunciar a la convocatoria ordinaria, el alumnado deberá comunicarlo con dos semanas de antelación a la fecha del examen.

Convocatoria extraordinaria: orientaciones y renuncia

En la convocatoria extraordinaria, el alumnado será evaluado de las mismas competencias que en la convocatoria ordinaria, para lo cual se establecen las siguientes herramientas de evaluación:

- Examen escrito, en el que el alumnado deberá demostrar su dominio de los conceptos explicados en las clases magistrales y que se encuentran descritos en los apuntes proporcionados.



- Trabajos de prácticas: Se deberá entregar una memoria de las prácticas propuestas según las indicaciones proporcionadas. Las prácticas deberán ser entregadas en la fecha de realización del examen escrito.

Temario

1. Speech production & perception

2. Basic concepts about speech signals

3. Speech signal representation

Bibliografía

Materiales de uso obligatorio

Los estudiantes dispondrán en eGela (http://egela.ehu.eus/) de los siguientes materiales



docentes necesarios para el desarrollo de la asignatura:



- Transparencias con el contenido teórico de la asignatura, temas T1-T3.



- Guión de prácticas, un fichero por práctica con introducción teórica.



- Señales necesarias, programas de matlab, scripts de linux y otras herramientas necesarias



para el desarrollo de las prácticas.

Bibliografía básica

A classical: Fant: Acoustic Theory of Speech Production (1960)

“The Production and Perception of Speech” Mark Tatham Katherine Morton (1997) -several versions and editions

Speech perception: R. Munkongand B. H. Juang, “Auditory perception and cognition” inIEEE Signal Processing Magazine, vol. 25, no. 3, pp. 98-117, May 2008.doi: 10.1109/MSP.2008.918418

http://auditoryneuroscience.comfor a general understanding of sound and brain. Lots of videos.

Revistas

Computer Speech and Language



Speech Communication



IEEE Transactions on Audio Speech and Language Processing



IEEE Transactions on Multimedia



Enlaces

P¿na de voz en la CMU http://www.speech.cs.cmu.edu/



European Languages Resources Association (ELRA) http://www.elra.info/en/catalogues/



Linguistic Data Consortium (LDC) https://www.ldc.upenn.edu/language-resources



Smithsonian Speech Synthesis History Project (SSSHP) http://www.mindspring.com/~ssshp/ssshp_cd/ss_home.htm



S¿esis de habla emocional http://emosamples.syntheticspeech.de/



Contenido de XSL

Sugerencias y solicitudes