Erabiltzaile Tresnak


hizk:1:5:12

Anbiguotasun

Anbiguotasuna hizkuntzaren berezko ezaugarrietako bat da, eta asko idatzi da berori buruz, bai LNPan bai Hizkuntzalaritza Orokorrean, arazoa ikuspuntu diferenteetatik planteatuz. Izan ere, oso eremu zabala da eta mota askotako alterazio linguistikoak egon daitezke.

Tratamendu automatikoari begira, gai hauxe bera da arazo gehien sortzen dituena: hitz batek adiera bat baino gehiago izan ditzake; batzuk gainera kategoria morfologiko desberdinekoak dira; esaldi batek analisi sintaktiko bat baino gehiago onar ditzake; egoeraren arabera esaldi berak esangura desberdinak eskain ditzake… Guk, gizakiok, gehienetan, egoeraren arabera ondo dakigu une bakoitzean adiera, kategoria eta analisi egokiak aukeratzen. Baina konputagailua orotariko informazioaz (lexikala, morfosintaktikoa, semantikoa nahiz pragmatikoa) hornitzerakoan eta guztiak konbinatuz prozesatzerakoan, askotan pentsatu ezinezko emaitzak sortzen dira, gizakioi burutik ere pasatzen ez zaizkigunak. Eta hori ebazteko lana ez da bat ere samurra.

Hortaz, Hizkuntzalaritza Konputazionalean maila guztietako anbiguotasunari erantzun behar zaio: lexiko-morfologikotik hasi pragmatikoraino; horren ondorioz, hizkuntzalaritza konputazionalaren arloan hizkuntza maila guztietako azterketek garrantzia handia dute. Hizkuntzalaritza orokorrean, ordea, anbiguotasunaren arazoa sintaxitik aurrera aztertu ohi da gehienbat.

Tratamendu independentea onartzen ez duten ezagutzak tratatu beharra Arestian aipatutako arazoari aurre egiteko, banatze-estrategia aplikatu ohi da. Estrategia horren arabera, problema handia hainbat azpiproblema independentetan banatzen dugu, ebazteko errazagoak direlakoan. Azpiproblemetarako lortuko ditugun ebazpenak, geroago, era egokian konbinatuko beharko ditugu problema osoaren ebazpena lortzeko. Estrategia hori oso lagungarria izaten da, baina aplikagaitza izaten da hizkuntzaren tratamendu automatikoan, erabili behar diren ezagutza motek elkarren artean mendekotasun handia izaten dutelako, hau da, azpiproblema independenteak bereiztea oso zaila delako.

Informatikako programazio-lengoaia bateko agindu bat analizatzen badugu, eta agindu horretan osagai bat bere kategoriako beste osagai batekin ordezten badugu, bere analisiaren emaitza berdina da; nahikoa da osagaia ordeztea. Baina hori ez da gertatzen hizkuntza tratatzerakoan. Esaldi bateko hitz bat aldatuz gero, esaldi berriaren analisia ez da beti esaldi zaharraren egitura berekoa. Hitz bat aldatuta esaldi osoaren egitura alda daiteke batzuetan. Adibidez, beheko (1) eta (2) esaldiak oso antzekoak dira; izen bat bakarrik aldatzen da batetik bestera:

(1)Gizon bat ikusi dut egunkari batekin

(2)Gizon bat ikusi dut teleskopio batekin

Ordea, (1) adibidean inori ez zaio bururatzen “nik egunkaria erabili dudala gizona ikusteko”, baizik eta “gizonak egunkaria duela eta nik horrela ikusi dudala”; (2) adibidean, aldiz, bi egitura eta esanahi bururatzen zaizkigu: “gizonak teleskopioa zeramala ikusi dudala” ((1) adibideko bera) edo “nik gizona teleskopioaren bidez ikusi dudala”.

Nola egin alde batetik, interpretazio horiek lortzeko eta bestetik, bakoitzari dagokiona erabakitzeko? Teleskopioa, ikusteko tresna izan daiteke; egunkaria, berriz, ez. Ordenagailuak informazio hori izango balu, gai izango litzateke egitura sintaktiko bakarraren alde egiteko (baina hori, gainera, bakarrik “ikusi” eta “egunkariarekin” batera daudenean; beste edozein esalditan ez dakigu). Bestalde, testuingurua zein den jakin behar da, hots, zein egoeratan ekoizten den esaldia. Esaterako, (2) adibiderako, pentsa genezake behatoki astronomiko batean gaudela, eta hortaz oso normala litzateke gizon bat teleskopio bat eskuetan duela ikustea.

Hau da, balizko interpretazioak lortzeko eta dagokiona aukeratzeko ezagutza lexikala (teleskopio eta egunkari hitzak), ezagutza sintaktikoa eta semantikoa (teleskopioa, ikusteko tresna da eta beraz ikusi aditzari lotuta azter daiteke; egunkaria ez) eta testuinguruari buruzkoa (zein egoeratan esan den) behar ditugu. Berez, ezagutza mota horiek guztiak batera erabili behar ditugu hizkuntzaren tratamendu automatiko egokia egiteko; baina ezinbestean pausuka joan behar dugu informazio hori guztia oraindik aztertu gabe dagoelako (bai LNPan bai Hizkuntzalaritza Orokorrean).

lanaren aipamena nola egin...

Euskara Institutua, EHU, "Anbiguotasun", Sareko Euskal Gramatika (SEG), www.ehu.eus/seg
ISBN: 978-84-693-9891-3