Materia

Contenido de XSL

Tratamiento del Habla

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

El objetivo de la asignatura es que los y las estudiantes se familiaricen con la señal de voz, así como con las técnicas básicas que se utilizan para su análisis y procesamiento. Para ello se describen los fundamentos de la producción del habla humana y de su percepción por el oído humano, para continuar con la definición de las técnicas básicas del procesamiento de señal de voz. El curso incluye numerosos ejercicios y prácticas para que alumnado trabaje con estos conceptos.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
HERNAEZ RIOJA, INMACULADA CONCEPCIONUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado Catedratico De UniversidadDoctoraNo bilingüeTeoría de la Señal y Comunicacionesinma.hernaez@ehu.eus
SARATXAGA COUCEIRO, IBONUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctorBilingüeIngeniería Telemáticaibon.saratxaga@ehu.eus

Competencias

DenominaciónPeso
Conocer e interpretar los procesos de generación y percepción de la voz humana.25.0 %
Analizar y explicar el análisis temporal y espectral de señales de voz.25.0 %
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz.25.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral1522.537.5
P. Ordenador304575

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Clases magistrales37.540 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas75.040 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Examen tipo test40.0 % 70.0 %
Informes/Memoria de Prácticas30.0 % 60.0 %

Resultados del aprendizaje de la asignatura

RA1 Describir los procesos de generación y percepción de la señal de voz.



RA2 Demostrar conocimientos sobre la representación temporal y frecuencial de la señal de voz y sobre las técnicas empleadas para su análisis



RA3 Medir e interpretar los principales parámetros que caracterizan la señal de voz.



RA4 Manejar herramientas de análisis y procesado de la señal de voz.

Convocatoria ordinaria: orientaciones y renuncia

El sistema de evaluación se divide en dos bloques independientes: magistral y prácticas de laboratorio.

La parte magistral se evalúa mediante una prueba individual escrita a partir de preguntas cortas y de elección múltiple (50%).

La parte de prácticas de laboratorio se evalúa mediante las memorias y el trabajo desempeñado en el laboratorio (50%).

En la convocatoria ordinaria deben superarse la prueba de la parte magistral con una nota mínima de 5 sobre 10, y para superar la asignatura debe obtenerse una nota final superior a 5 sobre 10 una vez agregadas todas las calificaciones. Cada bloque de evaluación es independiente y una vez superado un bloque la nota se guardará para sucesivas convocatorias.

RENUNCIA:

Las personas que no puedan seguir la evaluación mixta deberán justificar documentalmente sus causas al equipo docente, siguiendo el procedimiento establecido en la normativa vigente. Podrán acreditar el logro de los resultados de aprendizaje de la asignatura a través de una evaluación final que consistirá en: una prueba escrita (50% nota) y una prueba de laboratorio (50% nota).

Si una persona no se presenta a la prueba escrita final se entenderá que esa persona ha renunciado a dicha convocatoria.

Convocatoria extraordinaria: orientaciones y renuncia

En la convocatoria extraordinaria se harán dos pruebas: una prueba del bloque magistral y una prueba del bloque de laboratorio. Cada prueba contará por el 50% de la nota final y deben superarse ambas con una nota mínima de 5 sobre 10.

Aquellos estudiantes que no hayan presentado escrito que justifique su no participación en la evaluación mixta deberán acreditar la adecuada realización de las prácticas.

Temario

1. Speech production

2. Speech perception

3. Basic concepts about speech signals

4. Speech signal representation

Bibliografía

Materiales de uso obligatorio

Apuntes de la asignatura: magistrales y prácticas.

Bibliografía básica

X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)

L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978. (ISBN: 978-0132136037)

J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms and applications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)

D. Jurafsky, J. H. Martin. Speech and Language Processing (2nd edition). Prentice Hall, 2008. (ISBN: 978-0131873216)

Revistas

Computer Speech and Language



Speech Communication



IEEE Transactions on Audio Speech and Language Processing



IEEE Transactions on Multimedia



Enlaces

Página de voz en la CMU http://www.speech.cs.cmu.edu/



European Languages Resources Association (ELRA) http://www.elra.info/en/catalogues/



Linguistic Data Consortium (LDC) https://www.ldc.upenn.edu/language-resources



Smithsonian Speech Synthesis History Project (SSSHP) http://www.mindspring.com/~ssshp/ssshp_cd/ss_home.htm



Síntesis de habla emocional http://emosamples.syntheticspeech.de/