Breadcrumb

Eduki publikatzailea

Doktorego tesiaren defentsa: Baliabide urriko hizkuntzetarako hizkuntza-eredu neuronalak

Egilea: Gorka Urbizu Garmendia

Izenburua: Baliabide urriko hizkuntzetarako hizkuntza-eredu neuronalak

Zuzendariak: Aitor Soroa / Saralegi Urizar

Eguna: 2025eko urriaren 20an
Ordua: 11:00h
Lekua: Ada Lovelace aretoa (Informatikako fakultatea)

Abstract:

"Doktorego tesi honek baliabide urriko hizkuntzetarako hizkuntza-eredu neuronalak ditu aztergai, bereziki, euskaran arreta jarriz. Hiru ikerketa-galdera nagusi jorratu dira: euskararako hizkuntza-ereduak nola ebaluatu modu estrintsekoan, datu-eskasiak ereduaren errendimenduan duen eragina, eta euskararen ezaugarri linguistiko bereizgarriek aurrentrenamenduan duten eragina. Galdera horiei erantzuteko, ebaluazio-proba berriak garatu dira, besteak beste, euskararako hizkuntza ulermen orokorrerako BasqueGLUE proba-bankua eta gaitasun gramatikala ebaluatzeko BL2MP datu-multzoa. Bestalde, baliabide urriko hizkuntzetan BERT ereduek zer-nolako eskala-legeak jarraitzen dituzten eta euskara bezalako morfologia aberats eta hitz-ordena malguko hizkuntzetan gramatika ikasteko duten gaitasuna ikertu dira. Halaber, aurrentrenamendurako automatikoki itzulitako datu sintetikoak erabiltzearen bideragarritasuna aztertu da. Lan honek utzitako ondorioek eta baliabideek euskararako eta baliabide urriko beste hizkuntzetarako hizkuntza ereduen ikerketarako oinarri sendoa ezartzen dute."