euskaraespañol

Sare sozialak campusa

El centro HiTZ publica nuevos modelos abiertos de reconocimiento y síntesis de voz en euskera

  • Noticias

Fecha de primera publicación: 30/03/2026

Foto: Gemini

El centro HiTZ Hizkuntza Teknologiako Zentroa, centro de investigación en tecnologías del lenguaje de la Universidad del País Vasco / Euskal Herriko Unibertsitatea (EHU), anuncia la publicación de nuevos recursos abiertos para el desarrollo de tecnologías de voz en euskera: dos modelos de reconocimiento automático del habla (ASR) (uno monolingüe en euskera y otro bilingüe euskera/castellano) y dos voces de síntesis de voz (TTS) (una masculina y otra femenina) disponibles de forma libre y gratuita.

Estos recursos tecnológicos permitirán a investigadores, empresas y desarrolladores integrar el euskera en aplicaciones basadas en voz, contribuyendo así a reforzar la presencia de esta lengua en el ámbito de la inteligencia artificial y las nuevas interfaces digitales.

Los modelos de reconocimiento automático del habla permiten convertir voz hablada en euskera y castellano en texto con alta precisión, lo que facilita el desarrollo de aplicaciones como sistemas de transcripción automática, subtitulado en tiempo real, asistentes virtuales o interfaces conversacionales. Las evaluaciones realizadas muestran que el rendimiento de los modelos se sitúa entre los mejores disponibles actualmente para el reconocimiento automático del euskera.

Por su parte, las nuevas voces de síntesis de voz, que utilizan modelos neuronales, permiten generar habla natural en euskera a partir de texto, lo que posibilita su uso en lectores automáticos, sistemas de navegación, herramientas de accesibilidad o contenidos multimedia.

Los modelos han sido desarrollados y entrenados por el grupo de investigación Aholab del centro HiTZ en el marco del proyecto IKER-GAITU financiado por el Gobierno Vasco. También ha recibido financiación del Ministerio para la Transformación Digital y de la Función Pública y del Plan de Recuperación, Transformación y Resiliencia, en colaboración con el proyecto ILENIA, con referencia 2022/TL22/00215335. Asimismo, este trabajo ha contado con el apoyo de la infraestructura de computación de altas prestaciones de EJIE, que ha proporcionado las GPUs necesarias para el entrenamiento de los modelos. La publicación de los modelos bajo licencias abiertas permite su uso, adaptación e integración tanto en proyectos de investigación como en aplicaciones comerciales. Los nuevos modelos están disponibles en repositorios abiertos en línea.

Con esta iniciativa, HiTZ refuerza su compromiso con el desarrollo de tecnologías lingüísticas avanzadas para el euskera y con la creación de recursos abiertos que faciliten la innovación en el ámbito de la inteligencia artificial.

La disponibilidad de modelos abiertos de reconocimiento y síntesis de voz constituye un paso relevante para garantizar que el euskera pueda integrarse plenamente en las nuevas formas de interacción con la tecnología, favoreciendo el desarrollo de aplicaciones digitales que permitan utilizar la lengua en un número cada vez mayor de contextos.