Eduki publikatzailea

Ingeleseko entzuleen 3.000 'entzumen irristaldi' baino gehiagoko corpusa osatu dute

UPV/EHUn finkatutako taldeak antzeko corpus bat atera zuen aurretik gaztelaniarako

Lehenengo argitaratze data: 2017/02/16

Irudia
María Luisa García Lecumberri eta Martin Cooke. Argazkia: UPV/EHU

Hondo zarata dagoela, entzuleak pentsa dezake esandakoa ez beste hitz bat entzun duela. Sarritan gertatzen diren hutsegite horiei ‘entzumen irristaldi' esaten zaie (slips of the ear). UPV/EHUko irakasle María Luisa García Lecumberrik parte hartzen duen talde batek ingelesean ohiko pertzepzio hutsegiteen lehendabiziko corpus handia sortu du, 3.000 terminorekin baino gehiagorekin.

Normalean, ez dugu egoera optimoetan entzuten –hondo zaratak egon ohi dira: trafikoa, makinak, beste elkarrizketa batzuk–, baina, jatorrizko hiztunak garenez eta testuinguruak laguntzen digunez, gai gara heldu ez zaigun seinalearen zati hori osatzeko. Hala eta guztiz ere, hutsak egiten ditugu. María Luisa García Lecumberrik, Martin Cooke UPV/EHU Ikerbasque irakasleak eta Jon Barker eta Ricard Marxer Sheffieldeko Unibertsitateko ikertzaileek osatzen duten taldeak bat datozen 3.207 pertzepzio oker identifikatu ditu ingeleserako, hau da, entzule ugari bat datozen hutsegiteak.

Konkordantzia horiek baliagarriak dira hizkuntza hautemateko ereduak probatzeko eta gizakien pertzepzio mekanismoek nola funtzionatzen duten hobeto ulertzeko.

Horretarako, taldeak eskala handiko azterlan bat egin zuen, 212 parte hartzailerekin eta ikertzaileek testuingurutik ateratzen zituzten 300.000 hitz aurkezpenekin baino gehiagorekin (ikertzaileek bereiz aurkezten zituzten hitzak, hondo zaratarekin). Azterlanaren bidez, bat zetozen 3.207 pertzepzio oker identifikatu ahal izan ziren, eta aurretik sekula egin ez den corpus batean bildu (sarean eskura daiteke: http://spandh.dcs.shef.ac.uk/ECCC/). Okerreko pertzepzio bakoitzerako, corpusak honako hauek aurkezten ditu: esandako hitzaren eta hutsegitea sorrarazi zuen hondo zarataren soinu uhinak, entzuleek emandako erantzunak eta esandako eta hautemandako hitzaren transkripzio fonemikoak. Ikusi zen hainbat nahaste mota daudela. Kasu batzuetan, adibidez, garbi dago zaratak ezkutatzen zuela hitzaren zati bat, eta entzuleek zati entzungarriekin bat zetorren beste hitz bat imajinatzen zuten ("wooden" -> "wood" edo "pánico" -> "pan"), edo zati entzungaitzak beste soinu batzuekin ordezkatzen zituzten ("ten" -> "pen" eta "valla" -> "falla"). Beste kasu batzuetan, berriz, hondoko zarataren edo elkarrizketen zatiak gehituz osatzen zuten hitza ("purse" -> "permitted" edo "ciervo" -> "invierno"). Azkenik, entzule bat baino gehiago bat zetozen pertzepzio bitxiak ere aurkitu ziren, zeintzuetan ez zuten inolako antzik esandako hitzak eta ustez entzundakoak ("modern" -> "suggest" edo "guardan" -> "pozo"). Kasu horietan, hizketaren eta zarataren arteko interakzioa askoz ere konplexuagoa da, eta, beraz, interesgarriagoa ere bai.

"Azterlan hauei esker hobeto uler ditzakegu hizketa hautemateko mekanismoak, eta zenbat eta hobeto ezagutu mekanismo horiek, orduan eta hobeto lagundu ahal izango zaie pertzepzio arazoak dituztenei, bai teknikoki bai klinikoki", azaldu du ikertzaileak. Taldeak gaztelaniako entzumen irristaldien corpus bat kaleratu zuen aurretik, eta hura ere webgune berean kontsulta daiteke. "Bi hizkuntzen artean antzekotasunak eta aldeak daude: gaztelaniak flexio handiagoa du, eta, horren ondorioz, nahaste gehiago sortzen dira bukaeretan; ingelesak, berriz, silababakar gehiago ditu, eta kontsonante gehiago azken posizioan, eta hor oker gehiago gertatzen dira kontsonante bat beste batekin ordezkatzen delako", gehitu du. Hizkuntza bietan, zarata motaren arabera, hobeto irauten dute soinu eta silaba mota batzuek besteek baino.

Informazio gehigarria

María Luisa García Lecumberri doktoreak Ingeles Fonetika irakasten du UPV/EHUko Letren Fakultatean, eta Language and Speech Laboratory (LasLab) ikerketa taldeko kidea ere bada. Ikerbasqueko ikertzaile Martin Cooke doktorea ere talde horretako kidea da. Bestalde, Jon Barker doktore eta Speech and Hearing Research Group taldeko ikertzaileak Computer Science sailean irakasten du Sheffieldeko Unibertsitatean. Sail horretan bertan lan egiten du Ricard Marxer doktore eta ikertzaileak. Lana EBk finantzaturiko "INSPIRE: Investigating Speech Processing in Realistic Environments" FP7-PEOPLE-2011-290000 proiektuaren barruan egin zen.

Erreferentzia bibliografikoa