Publicador de contenidos

Grupo de Trabajo en Tecnologías Software (GTTS)

Datos generales

Ubicación
Facultad de Ciencia y Tecnología
Investigador/a principal
María Amparo Varona Fernández
Número de doctores/as
4
Número de integrantes
4
Correo electrónico
amparo.varona@ehu.eus
Página web
(Abre una nueva ventana) http://gtts.ehu.es

Personal

  • Germán Bordel García
  • Mikel Peñagarikano Badiola
  • Luis Javier Rodríguez Fuentes
  • María Amparo Varona Fernández

Líneas de investigación

GTTS desarrollan su actividad investigadora desde hace más de 10 años y centra su investigación en el procesamiento de la voz: segmentación de audio, reconocimiento de la lengua, reconocimiento del locutor, transcripción automática del habla, recuperación de información (indexado y búsqueda en recursos multimedia), subtitulado automático y detección de términos hablados.

Desde 2010, GTTS presta servicio al Parlamento Vasco para el subtitulado de los vídeos de las Sesiones Plenarias a partir del texto de las actas oficiales. GTTS trata de mejorar la calidad de los subtítulos actuando sobre el decodificador fonético, el algoritmo de alineamiento y la ergonomía.

Además, el grupo dispone de un sistema de indexado y búsqueda de información en recursos multimedia (Hearch: http://gtts.ehu.es/Hearch/), diseñado y puesto en marcha en el marco del proyecto SABUESO (TIN2009-07446). Se está trabajando en incrementar su funcionalidad con la integración de los sistemas automáticos de verificación del locutor y de la lengua.

Oferta de transferencia e innovación

GTTS ofrece su experiencia a través de la formación de investigadores, la difusión de resultados y la transferencia de tecnología para el desarrollo de productos comerciales. Desde una perspectiva social, GTTS contribuye al acceso a recursos hablados, mediante sistemas de búsqueda en recursos audiovisuales basados en contenidos y sistemas de subtitulado para personas con discapacidades auditivas. A nivel económico, organizaciones con necesidades de gestión de contenidos audiovisuales (medios de comunicación, instituciones públicas) podrían beneficiarse de nuestro asesoramiento y tecnología para incrementar la eficiencia de los procesos actuales de búsqueda y generación de metadatos y para reducir los costes de producción.

Equipamiento

  • Equipamiento para cómputo y almacenamiento: equipos de adquisición de datos, servidores de cómputo intensivo y servidores de disco para almacenamiento masivo de datos, ubicados en una sala especial con doble unidad de aire acondicionado y baterías de respaldo.
  • Entorno de desarrollo de aplicaciones de procesamiento del habla, escrito en Java, de código abierto, denominado Sautrela (http://gtts.ehu.es/TWiki/bin/view/Sautrela).
  • Bases de datos de habla y otros recursos lingüísticos con las que estimar los modelos y evaluar los sistemas, obtenidos en su mayoría mediante suscripción al Linguistic Data Consortium (https://www.ldc.upenn.edu), siendo GTTS coordinador de la suscripción para toda la UPV/EHU (http://gtts.ehu.es/gtts/ldc/ldc.jsp).
  • Puesto que el grupo ha participado en las NIST Language Recognition Evaluations (LRE) en 2007, 2009, 2011, 2015 y 2017, en las NIST Speaker Recognition Evaluations (SRE) en 2008, 2010 y 2012, en la NIST Speaker Recognition i-Vector Machine Learning Challenge en 2013-2014 y en la NIST Language Recognition i-Vector Machine Learning Challenge en 2015, dispone también de las bases de datos suministradas por el NIST para dichas evaluaciones (https://www.nist.gov/programs-projects/speaker-and-language-recognition). Estas bases de datos tienen especial relevancia en el área, ya que se utilizan como referencia para comparar sistemas y probar nuevas aportaciones.

Proyectos destacados

Título: Subtitulado automático de vídeos de sesiones del Parlamento Vasco usando las actas
Empresa / Administración financiadora: Parlamento Vasco, 6.000 €/año (aproximadamente)
Período-Duración: indefinido, desde julio de 2010
Responsable: Germán Bordel García

Título: Subvención General a Grupos de Investigación
Empresa / Administración financiadora: UPV/EHU (GIU 13/28, Evaluación ANEP), 37.000 €
Período-Duración: de diciembre de 2013 a noviembre de 2016
Responsable: Luis Javier Rodríguez Fuentes

Título: Subvención General a Grupos de Investigación
Empresa / Administración financiadora: UPV/EHU (GIU16/68, Evaluación ANEP), 12.000 €
Período-Duración: de marzo de 2017 a marzo de 2020
Responsable: María Amparo Varona Fernández