euskaraespañol

photocampus: eguneko irudia

Redes sociales campusa

Gipuzkoako Foru Aldundiak Hitz Zentroaren eta Euskorporaren esku jarriko ditu bere testu eta eduki corpusak

Helburua da euskara adimen artifizialeko teknologietan integratzea

  • Albisteak

Lehenengo argitaratze data: 2026/02/02

Ezkerraldean: Eneko Agirre HiTZ Zentroaren zuzendaria eta Juana Goizueta EHUko Gipuzkoako Campuseko errektoreordea; erdian: Eider Mendoza Gipuzkoako diputatu nagusia; eskubialdean: Garbiñe Mendizabal Hizkuntza Berdintasuneko foru zuzendaria eta Leire Barañanok, Euskorpora egitasmoko zuzendaria | Argazkia: GFA

Gipuzkoako diputatu nagusiak hitzarmena sinatu du EHUko Hitz Zentroko eta Euskorporako ordezkariekin; hurrenez hurren, ‘Oinitza’ eta ‘Euskorpus’ proiektuei ekarpena egingo die foru erakundeak.

Gipuzkoako Foru Aldundiak Euskal Herriko Unibertsitateko (EHU) HiTZ Zentroaren eta Euskorporaren esku jarriko ditu bere jabegokoak diren eduki eta datu corpusak, euskara adimen artifizialeko teknologietan integratzeko ahaleginean ekarpena egin asmoz. Hitzarmena sinatu du foru erakundeak bi eragileokin eta elkarlan horren inguruko lan bilera egin dute gaur goizean, hain zuzen ere helburu partekatu horretan lankidetzan jarduteko konpromisoa berretsiz.

“Euskararen etorkizuna jokoan dagoen eremu guztietan, ekarpena egiten jarraitu nahi dugu, lankidetza eta berrikuntza ardatz hartuta. Adimen artifiziala, hizkuntza teknologiak eta, oro har, eremu digitala lehentasunezkoak dira gure hizkuntzarentzat eta, beraz, gure lurraldearentzat eta herriarentzat”, adierazi du diputatu nagusiak, Hizkuntza Berdintasuneko foru zuzendari Garbiñe Mendizalekin batera. EHUko HiTZ Zentroaren izenean, Eneko Agirre zuzendariak hartu du parte topaketan, baita Euskal Herriko Unibertsitateko Gipuzkoako campuseko errektoreordeak ere, Joana Goizuetak, alegia. Euskorporaren izenean, lan bileran parte hartu du Leire Barañanok, Euskorpora egitasmoko zuzendariak.

Agirrek gogorarazi duenez, “euskararen biziraupenerako oso garrantzitsua da mugikor eta gailu digitalak euskaraz ondo aritzea, inguruko erdarak bezain ondo”. “Tamalez, erraldoi teknologikoek ez dute ziurtatzen kalitatezko euskara sortzea. Horretarako ikerkuntza gakoa da, euskararako datu gutxiago baitaude. Hitzarmen honi esker, HiTZ zentroan garatzen ari garen Latxa bezalako hizkuntza eredu publiko eta irekiak hobeto elikatu ahal izango ditugu, administrazioaren inguruko gaietan ere ondo ibili daitezen”, azpimarratu du. HiTZ Zentroko zuzendariak gaineratu duenez, “Adimen Artifizialean egiten dugun puntako ikerkuntza bultzatzen laguntzen digu honek, alor honetan erreferentzia izaten jarraitzeko, eta ikerkuntza hori era eraginkorrean gizartera helarazteko, administrazio eta industriako beharretara egokitutako ereduei esker”.

Leire Barañanok, berriz, azaldu du Euskorpora sortu dela, “modu metodikoan, edukien kopuru eta aniztasun zabala biltzeko”, ondoren eduki horiek “eraldatu eta kalitate nahikoa duen audio eta testu bidezko corpus digital sendoa” sortzea helburu. “Corpus horrek aukera emango du, etorkizunean, sektore publiko zein pribatuko hainbat esparruren beharretara egokitutako ereduak eta aplikazioak garatzeko. Horrek aukera emango du eredu  berriak bultzatzeko, bai nazioartean dagoeneko existitzen diren soluzioak entrenatu eta egokitzeko, betiere euskararen presentzia eta garapena bermatuz ingurune teknologiko hauetan”, nabarmendu du Euskorporako zuzendariak. Bere esanetan, foru erakundearekin sinatutako hitzarmena “bereziki garrantzitsua” da, Aldundiak eskainiko dituen eduki guztiak “bildu, eraldatu eta komunitatearen zerbitzura jartzeko aukera” eskainiko baitu. “Urrats honek aurrerapauso erabakigarria dakar euskarazko ekosistema digitala sendotzeko eta haren etorkizuna arlo teknologiko eta estrategikoetan bermatzeko”, balioa eman dio.

Elkarlanean

Sinatutako bi lankidetza hitzarmen hauen bitartez, Gipuzkoako Foru Aldundia EHUko Hitz Zentroaren Oinitza proiektuko eta Euskorporaren Euskorpus proiektuaren kolaboratzaile bilakatuko da, aldi berean. Oinitzaren helburua da euskarazko testuak eta metadatuak biltzea hizkuntza teknologiak eta adimen artifiziala euskaraz garatu ahal izateko, hau da, ahalik eta eduki egokienak eta ugarienak biltzea euskarazko hizkuntza ereduak sortu ahal izateko. Euskorpus proiektuaren helburua, era berean, euskararen presentzia digitala sustatzea eta bermatzea da, euskarazko corpus linguistiko digitalak bilduz eta osatuz, nahiz euskarazko kode irekiko ereduak garatuz. Bi proiektuak osagarriak dira eta, horrela, HiTZ eta Euskorpora elkarlanean ari dira hitzarmenei ahal den etekin handiena ateratzeko.

Aldundiak lagatako testu eta eduki corpusetako jatorrizko datuak aurre prozesatu eta tratatu egingo dituzte Hitz Zentroak eta Euskorporak, hizkuntza eredu eta osagai linguistikoak entrenatzeko eta, horrela, euskara adimen artifizialeko teknologietan integratzeko. Foru erakundeak lanketarako eskuragarri jarriko dituen datuek ez dute inolako informazio pertsonalik izango eta, edonola ere, erakundearen informazioaren segurtasuneko eta datu pertsonalen babeseko arauak eta neurriak bermatuko dira.

HiTZ, Hizkuntza Teknologiako Euskal Zentroa, Euskal Herriko Unibertsitateko ikerketa zentroa da. Hizkuntza eta ahotsa ardatz dituen adimen artifizialean dihardu, ikerketan, prestakuntzan, transferentzia teknologikoan eta berrikuntzan. Berariaz euskarazko teknologiak lantzen ditu.

Euskorpora irabazi-asmorik gabeko elkartea da, hizkuntza gutxituen corpus digitalak sustatzea, sortzea eta garatzea helburu duena, euskarari lehentasuna emanez. Corpus digital horiek, halaber, adimen artifizialeko teknologietan edo antzekoetan erabiltzen dira, hizkuntza soluzioak entrenatzeko eta hobetzeko: transkripzio automatikoa, azpitituluak edo itzulpen automatikoa, esate baterako.