Subject

XSL Content

Speech Processing

General details of the subject

Mode
Face-to-face degree course
Language
English

Description and contextualization of the subject

El objetivo de la asignatura es que los y las estudiantes se familiaricen con la se¿de voz, as¿omo con las t¿icas b¿cas que se utilizan para su an¿sis y procesamiento. Para ello se describen los fundamentos de la producci¿el habla humana y de su percepci¿or el o¿ humano, para continuar con la definici¿e las t¿icas b¿cas del procesamiento de se¿de voz. El curso incluye numerosos ejercicios y pr¿icas para que alumnado trabaje con estos conceptos.

Teaching staff

NameInstitutionCategoryDoctorTeaching profileAreaE-mail
HERNAEZ RIOJA, INMACULADA CONCEPCIONUniversity of the Basque CountryProfesorado Catedratico De UniversidadDoctorNot bilingualTheory of Signals and Communicationsinma.hernaez@ehu.eus
SARATXAGA COUCEIRO, IBONUniversity of the Basque CountryProfesorado AgregadoDoctorBilingualTelematics Engineeringibon.saratxaga@ehu.eus

Competencies

NameWeight
Conocer e interpretar los procesos de generación y percepción de la voz humana.25.0 %
Analizar y explicar el análisis temporal y espectral de señales de voz.25.0 %
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz.25.0 %

Study types

TypeFace-to-face hoursNon face-to-face hoursTotal hours
Lecture-based1522.537.5
Applied computer-based groups304575

Assessment systems

NameMinimum weightingMaximum weighting
Internship Report/Summary30.0 % 60.0 %
Multiple-choice examination40.0 % 70.0 %

Learning outcomes of the subject

RA1 Describir los procesos de generaci¿ percepci¿e la se¿de voz.

RA2 Demostrar conocimientos sobre la representaci¿emporal y frecuencial de la se¿de voz y sobre las t¿icas empleadas para su an¿sis.

RA3 Medir e interpretar los principales par¿tros que caracterizan la se¿de voz.

RA4 Manejar herramientas de an¿sis y procesado de la se¿de voz.

Ordinary call: orientations and renunciation

Para la evaluación del alumnado en convocatoria ordinaria se utilizarán las siguientes herramientas:



- Examen escrito



Al final del curso se realizará un examen escrito. En él el alumnado deberá demostrar su dominio de los conceptos explicados en las clases magistrales y que se encuentran descritos en los apuntes proporcionados.



- Trabajos de prácticas

Las prácticas se realizarán parcialmente durante las clases presenciales. El alumno deberá entregar obligatoriamente una memoria de las prácticas realizadas, según las indicaciones proporcionadas. Las prácticas deberán ser entregadas en las fechas indicadas durante el curso.



Para renunciar a la convocatoria ordinaria, el alumnado deberá comunicarlo con dos semanas de antelación a la fecha del examen.

Extraordinary call: orientations and renunciation

En la convocatoria extraordinaria, el alumnado será evaluado de las mismas competencias que en la convocatoria ordinaria, para lo cual se establecen las siguientes herramientas de evaluación:

- Examen escrito, en el que el alumnado deberá demostrar su dominio de los conceptos explicados en las clases magistrales y que se encuentran descritos en los apuntes proporcionados.



- Trabajos de prácticas: Se deberá entregar una memoria de las prácticas propuestas según las indicaciones proporcionadas. Las prácticas deberán ser entregadas en la fecha de realización del examen escrito.

Temary

1. Speech production

2. Speech perception

3. Basic concepts about speech signals

4. Speech signal representation

Bibliography

Compulsory materials

Apuntes de la asignatura: magistrales y pr¿icas.

Basic bibliography

X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)

L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978. (ISBN: 978-0132136037)

J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms and applications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)

D. Jurafsky, J. H. Martin. Speech and Language Processing (2nd edition). Prentice Hall, 2008. (ISBN: 978-0131873216)

Journals

Computer Speech and Language

Speech Communication

IEEE Transactions on Audio Speech and Language Processing

IEEE Transactions on Multimedia

Links

P¿na de voz en la CMU http://www.speech.cs.cmu.edu/

European Languages Resources Association (ELRA) http://www.elra.info/en/catalogues/

Linguistic Data Consortium (LDC) https://www.ldc.upenn.edu/language-resources

Smithsonian Speech Synthesis History Project (SSSHP) http://www.mindspring.com/~ssshp/ssshp_cd/ss_home.htm

S¿esis de habla emocional http://emosamples.syntheticspeech.de/

XSL Content

It was not possible to load the content, please try again later. In case the problem persists contact CAU (Phone: 916014400 / E-mail: cau@ehu.eus / Website: https://lagun.ehu.eus).