Gaia

XSLaren edukia

Hizketa Teknologiak

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

Irakasgaiaren helburua ikasleak ahots-seinalearen prozesamenduaren oinarrizko aplikazioekin ohitzea da, hala nola sintesiarekin eta hizketaren ezagutza automatikoarekin. Ikuspegi praktiko batetik, bi teknologietan eman diren paradigma nagusiak aztertuko dira, sistema horiek sortzeko prozedurak deskribatuko dira, eta baita beharrezkoak diren baliabideak eta ahots datu baseak sortzeko. Ikasleek sistema errealekin praktikatuko dute. Horrez gain, ahotsaren prozesamenduarekin lotutako beste aplikazio batzuk ere berrikusiko dira labur-labur, hala nola esatariaren edo emozioaren ezagutza, ahotsaren bihurketa edo diarizazioa, besteak beste.

Ikasgai hau ikasteko, ikasleak mintzamena ekoizteko oinarrizko ereduak, seinalearen denborazko eta maiztasunezko analisiaren kontzeptuak eta seinaleak digitalizatzeko oinarriak ezagutu behar ditu.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
NAVAS CORDON, EVAEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebakarraSeinalearen Teoria eta Komunikazioakeva.navas@ehu.eus
SARATXAGA COUCEIRO, IBONEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaIngeniaritza Telematikoaibon.saratxaga@ehu.eus

Gaitasunak

IzenaPisua
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz.25.0 %
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de reconocimiento de la señal de voz.25.0 %
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista.25.0 %
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz.25.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala1522.537.5
Ordenagailuko p.304575

Irakaskuntza motak

IzenaOrduakIkasgelako orduen ehunekoa
Eskola magistralak37.540 %
Ordenagailuko praktikak, irteerak, bisitak75.040 %

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Azalpenak20.0 % 40.0 %
Praktiken Memoria/Txostenak20.0 % 50.0 %
Test motako azterketa30.0 % 60.0 %

Irakasgaia ikastean lortuko diren emaitzak

RA1 Demostrar comprensión de los problemas relacionados con el modelado acústico de la señal de voz,

RA2 Manejar herramientas de análisis y procesado de la señal de voz.

RA3 Demostrar comprensión sobre los sistemas de reconocimiento automático del habla, del hablante y de síntesis de voz, así como las técnicas utilizadas para la evaluación de los mismos.

RA4 Desarrollar un sistema básico de reconocimiento del habla.

RA5 Extraer información de un artículo científico y presentarla de forma oral a un público interdisciplinar e internacional.

Ohiko deialdia: orientazioak eta uko egitea

Ebaluazio-sistema hiru multzo independentetan banatzen da: magistrala, laborategiko praktikak eta hizketa-teknologia bati buruzko lan baten azalpena.

Alderdi magistrala banakako idatzizko proba baten bidez ebaluatzen da, galdera laburretatik eta aukera anitzeko galderetatik abiatuta (% 40).

Laborategiko praktiken zatia memorien eta laborategian egindako lanaren bidez ebaluatzen da (% 40).

Lanaren azalpena jendaurreko aurkezpen batekin ebaluatzen da (% 20).

Ohiko deialdian alderdi magistraleko proba gainditu behar da 10etik 5eko gutxieneko notarekin, eta irakasgaia gainditzeko 10etik 5etik gorako amaierako nota lortu behar da kalifikazio guztiak gehitu ondoren. Ebaluazio-bloke bakoitza independentea da, eta bloke bat gainditu ondoren, nota hurrengo deialdietarako gordeko da.

UKO EGITEA:

Ebaluazio mistoa egin ezin dutenek arrazoiak justifikatu beharko dizkiote irakasle taldeari, indarrean dagoe araudian ezarritako prozedurari jarraikiz. Irakasgaiaren ikaskuntzaren emaitzak azken ebaluazio baten bidez frogatu ahal izango dituzte: idatzizko proba bat (%40 nota), laborategiko proba bat (%45 nota) eta hizketaren teknologiarekin zerikusia duen lan bat aurkeztea (%15 nota).

Pertsona bat azken proba idatzira aurkezten ez bada, ulertuko da pertsona horrek deialdi horri uko egin diola.

Ezohiko deialdia: orientazioak eta uko egitea

Aparteko deialdian bi proba eginen dira: bloke magistraleko proba bat eta laborategiko proba bat. Proba bakoitzak azken notaren% 50 izanen du eta biak gainditu beharko dira, gutienez ere 5 puntu 10etik.

Ebaluazio mistoan parte hartu ez dutela frogatzen duen idazkirik aurkeztu ez duten ikasleek praktikak behar bezala egin dituztela frogatu beharko dute.

Irakasgai-zerrenda

1. Speech modelling

2. Speech synthesis

3. Speech recognition

4. Other speech technologies

Bibliografia

Nahitaez erabili beharreko materiala

Apuntes de la asignatura: magistrales y prácticas.

Oinarrizko bibliografia

X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)

D. Jurafsky, J. H. Martin. Speech and Language Processing (2nd edition). Prentice Hall, 2008. (ISBN: 978-0131873216)

P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN: 978-0521899277)

L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN: 978-0130151575)

D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer, 2015. (ISBN: 978-1447157786)

W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)

Aldizkariak

Computer Speech and Language



Speech Communication



IEEE Transactions on Audio Speech and Language Processing



IEEE Transactions on Multimedia



Estekak

Página de voz en la CMU http://www.speech.cs.cmu.edu/



European Languages Resources Association (ELRA) http://www.elra.info/en/catalogues/



Linguistic Data Consortium (LDC) https://www.ldc.upenn.edu/language-resources



Smithsonian Speech Synthesis History Project (SSSHP) http://www.mindspring.com/~ssshp/ssshp_cd/ss_home.htm



Síntesis de habla emocional http://emosamples.syntheticspeech.de/