Wikipedia eta itzulpen automatikoa: «harri batez bizpalau xori»

Iñaki Alegria, Unai Cabezón, Unai Fernandez de Betoño, Gorka Labaka, Aingeru Mayor, Kepa Sarasola, Arkaitz Zubiaga

Laburpena


Artikulu honetan elkarlanean egindako proiektu bat aurkezten dugu. Boluntario talde bat bildu dugu espainierazko Wikipediako hainbat artikulu euskarara itzultzeko, baina boluntarioen lana errazteko, Matxin itzultzaile automatikoa erabili dugu aurreitzulpenak sortzeko, eta horrela boluntarioen lana errore eta akatsak dituzten itzulpen automatiko horiek aztertu eta zuzentzea izan da. Lan honekin, batetik, Euskal Wikipedia aberastu dugu, 50.000 hitz berri gehituz. Beste alde batetik, sistema automatikoaren itzulpenak eta posteditatutako bertsio zuzenduekin corpus bat sortu dugu. Corpus hori erabili dugu posteditore estatistiko bat sortzeko, Matxin itzulpen automatikoko sistemaren irteeraren doitasuna % 10ean hobetuz. 


Gako-hitzak


Wikipedia; itzulpen automatikoa; corpus

Testu osoa:

PDF


 

 

ISSN: 0214-9001

e-ISSN: 2444-3255

(C) UPV/EHU Press

Resultado de imagen de e-mail ekaia@ehu.eus / asier.vallejo@ehu.eus