La diputada general de Gipuzkoa firma el convenio con representantes de Hitz Zentroa de la EHU y de Euskorpora; la institución foral contribuirá, respectivamente, a los 'proyectos ‘Oinitza’ y ‘Euskorpus’.
La Diputación Foral de Gipuzkoa pone a disposición de HiTZ Zentroa y Euskorpora sus corpus de contenidos
El objetivo es integrar el euskera en las tecnologías de inteligencia artificial
- Noticias
Fecha de primera publicación: 02/02/2026
La Diputación Foral de Gipuzkoa pondrá a disposición del centro HiTZ Zentroa de la Universidad del País Vasco / Euskal Herriko Unibertsitatea (EHU) y Euskorpora los corpus de datos y contenidos de su titularidad, con el fin de contribuir al esfuerzo de integrar el euskera en las tecnologías de inteligencia artificial. La institución foral ha firmado el convenio con ambos agentes y esta mañana han mantenido una reunión de trabajo en torno a esta colaboración, reafirmando así su compromiso de cooperar en este objetivo compartido.
“Queremos seguir contribuyendo en todos los ámbitos en los que se juega el futuro del euskera, tomando como ejes la colaboración y la innovación. La inteligencia artificial, las tecnologías del lenguaje y, en general, el ámbito digital son prioritarios para nuestra lengua y, por lo tanto, para nuestro territorio y nuestro país”, ha señalado la diputada general, acompañada por la directora foral de Igualdad Lingüística, Garbiñe Mendizabal. En representación del centro HiTZ Zentroa de EHU, Eneko Agirre, director del centro, ha participado en el encuentro, así como la vicerrectora del campus de Gipuzkoa de la Universidad del País Vasco, Juana Goizueta. En representación de Euskorpora, ha tomado parte en la reunión Leire Barañano, directora del proyecto Euskorpora.
Agirre ha recordado que "para la supervivencia del euskera es muy importante que los móviles y dispositivos digitales se expresen bien euskera, tan bien como el resto de idiomas". "Lamentablemente, los gigantes tecnológicos no garantizan la generación de euskera de calidad. Para ello, la investigación resulta clave, ya que existen menos datos en euskera. Gracias a este convenio, podremos alimentar de mejor manera los modelos lingüísticos públicos y abiertos como Latxa, que estamos desarrollando en el centro HiTZ, para que también funcionen eficazmente en temas relacionados con la administración", ha subrayado. El director de HiTZ Zentroa ha añadido que esta colaboración sirve de ayuda para “impulsar nuestra investigación puntera en Inteligencia Artificial, para seguir siendo referencia en este campo y para trasladar esa investigación de forma eficaz a la sociedad, gracias a modelos adaptados a las necesidades de la administración y la industria".
Leire Barañano, por su parte, ha explicado que Euskorpora se ha creado para recabar, "de forma metódica, gran cantidad y diversidad de contenidos" que permitan crear un "corpus digital sólido de audio y texto que los transforme y tenga calidad suficiente". "Este corpus permitirá en el futuro desarrollar modelos y aplicaciones adaptadas a las necesidades de diferentes ámbitos, tanto del sector público como del privado. Esto permitirá impulsar nuevos modelos, tanto para entrenar como para adaptar soluciones que ya existen a nivel internacional, siempre garantizando la presencia y el desarrollo del euskera en estos entornos tecnológicos", ha destacado la directora de Euskorpora. Según ha comentado, el convenio con la institución foral lleva consigo un avance "especialmente importante", ya que ofrecerá la posibilidad de "recopilar, transformar y poner al servicio de la comunidad" todos los contenidos que ofrecerá la Diputación. "Este paso supone un paso decisivo para consolidar el ecosistema digital en euskera y garantizar su futuro en áreas tecnológicas y estratégicas", ha puesto en valor.
Colaboración
A través de estos dos convenios de colaboración firmados, la Diputación Foral de Gipuzkoa se convertirá simultáneamente en colaboradora del proyecto Oinitza de HiTZ Zentroa de EHU y del proyecto Euskorpus de Euskorpora. El objetivo de Oinitza es recopilar textos y metadatos en euskera para desarrollar tecnologías del lenguaje e inteligencia artificial en euskera; es decir, reunir los contenidos adecuados y suficientes para crear modelos lingüísticos en euskera. El objetivo del proyecto Euskorpus, por su parte, es promover y garantizar la presencia digital del euskera, recopilando y completando corpus lingüísticos digitales en euskera, así como desarrollando modelos de código abierto en euskera. Ambos proyectos son complementarios, de manera que HiTZ y Euskorpora colaboran para poder sacar el máximo rendimiento a los convenios firmados.
Los datos originales de los corpus de textos y contenidos cedidos por la Diputación serán preprocesados y tratados por HiTZ Zentroa y Euskorpora, respectivamente con el fin de entrenar modelos lingüísticos y componentes de lenguaje y, de este modo, integrar el euskera en las tecnologías de inteligencia artificial. Los datos que la institución foral pondrá a disposición para este trabajo no contendrán ninguna información personal y, en cualquier caso, se garantizarán las normas y medidas de seguridad de la información y de protección de datos personales de la institución.
HiTZ, el Centro Vasco de Tecnología del Lenguaje, es un centro de investigación de la Euskal Herriko Unibertsitatea (EHU). Trabaja en inteligencia artificial centrada en el lenguaje y la voz, en investigación, formación, transferencia tecnológica e innovación. Desarrolla específicamente tecnologías en euskera.
Euskorpora es una asociación sin ánimo de lucro cuyo objetivo es promover, crear y desarrollar corpus digitales de lenguas minorizadas, dando prioridad al euskera. Estos corpus digitales se utilizan, además, en tecnologías de inteligencia artificial o similares, para entrenar y mejorar soluciones lingüísticas: transcripción automática, subtitulado o traducción automática, por ejemplo.