w_GTTS

Grupo de Trabajo en Tecnologías Software (GTTS)

 
Departamento(s)
Electricidad y Electrónica
Área(s) de la ciencia
Ciencias de la Computación y Tecnología Informática (INF)
IP: Amparo Varona Fernández Co-IP:

Miembros

Germán Bordel García, Mikel Peñagarikano Badiola, Luis Javier Rodríguez Fuentes

Palabras Clave

Aprendizaje Automático (Machine Learning, Deep Learning), Reconocimiento de la Lengua, Reconocimiento del Locutor, Detección de Términos Hablados, Reconocimiento Automático del Habla, Alineamiento Automático Voz-Texto, Subtitulado Automático, Diseño y Adquisición de Bases de Datos de Habla

Descripción

Desde aproximadamente 2005, GTTS desarrolla su actividad investigadora alrededor del procesamiento del habla. Desde 2010, presta servicio al Parlamento Vasco para el subtitulado de los vídeos de las sesiones plenarias a partir del texto de las actas oficiales. El grupo de investigación trabaja en el desarrollo de mejoras algorítmicas en la búsqueda de términos (especificados mediante texto o voz) en señales de audio, utilizando técnicas de aprendizaje automático, entre ellas redes neuronales profundas. A lo largo de los años, el grupo ha hecho distintas contribuciones en verificación de la lengua y del locutor, y ha participado en las evaluaciones internacionales de tecnología NIST 2007, 2009, 2011, 2015, 2017 Language Recognition Evaluation y NIST 2008, 2010, 2012, 2019 Speaker Recognition Evaluation. En 2019 GTTS obtuvo, junto con el grupo Aholab de la Escuela de Ingenieros de Bilbao, la acreditación como Grupo de Investigación A (Aholab-GTTS: Audio, Speech and Language Processing Group) en la convocatoria general de grupos de investigación del Gobierno Vasco.

Líneas de Investigación​​​

  1. Subtitulado de recursos multimedia multilingües
  2. Reconocimiento automático del habla
  3. Búsqueda de términos en recursos audiovisuales
  4. Reconocimiento de la lengua y del locutor

Equipamiento

El grupo dispone de 6 servidores de cómputo con capacidad de entre 9000 y 47000 MFlops, memoria entre 24 y 128 GB, todos ellos bajo CentOS y uno de ellos con GPUs, así como 2 servidores de disco NAS (unidad principal: 40TB, unidad de backup: 80TB). El grupo también dispone de numerosas bases de datos de habla, algunas propias y otras obtenidas a través de las evaluaciones del NIST o bien gracias a una suscripción al LDC (Linguistic Data Consortium).

Enlace página web

http://gtts.ehu.es

Contacto

amparo.varona@ehu.eus