Erabiltzaile Tresnak


hizk:1:5

Semantika

Ordenagailuak perpausak ulertzea da semantika konputazionalaren helburua, eta horixe da lengoaia naturalaren prozesamenduan diharduten guztiek duten azken ametsa. Hizkuntza teknologiako aplikazio mota guztiek, itzulpen automatikoak zein informazio-erauzketarako sistema automatikoek esaterako, emaitza hobeak lortzen baitituzte esaldien esanahia kontuan hartuz gero.

Baina semantikaren tratamendua LNPko alderik zailena da, ez baitago ordenagailuan inplementa daitekeen esanahiaren teoria sendorik. Alde horretatik, Montague-ren gramatika izan da teoria semantiko inportanteena (1973). Teoria horren konposagarritasun-printzipioaren arabera posible da eraikitzea osagai sintaktiko baten errepresentazio semantikoa bere azpiosagaien errepresentazioak konbinatuz. Hala ere, bide luzea egin beharko da oraindik esanahiaren teoria orokor eta oso bat baliatu ahal izan arte.

Sintaxiaren informazioa unitatea hitza da (edo morfema), baina semantikako unitatea hitzen adierak dira. Hitz berak adiera bat baino gehiago edukitzen du. Adiera posibleen identifikazioa, formalizazioa eta haien arteko erlazioa semantikaren oinarri-oinarria da. Hizkuntza baten hitz adiera guztiak ontologia modura antolatzen dira, geroago sailkapen hori adiera-desanbiguazioan eta adiera horien propietateak modu trinkoan definitu ahal izateko. Wordnet baliabide lexiko-semantikoaren agerpena mugarri historikoa izan zen, ingeleserako ohiko hitz guztietarako adierak biltzen baitzituen eta gainera banaketa libre eskaintzen zuelako. Geroago beste hizkuntzetarako bertsioak ere definitu izan dira. EuskalWordnet baliabidea euskarazko hitz-adierak batu ditu, eta EuroWordnet proiektuaren barruan kokatuta dagoenez hitz-adierak ingelesez, espainieraz, katalanez eta euskaraz ikus daitezke.

LNPren historian zehar, une batzuetan pentsatu izan da analisi semantikoa problemarik gabe egin zitekeela. Adibidez, 60ko hamarkada izan zen une horietako bat, adimen artifizialaren hasierako une historiko ospetsuenetan. Orduan pentsatu zen testuen esanahia analizatu ahal izango zela bat ere ezagutza linguistikorik gabe. Gaur egun, aldiz, analisi semantikoaren zailtasunez jabetu dira LNPko arlokoak, eta badakite aukerak mugatuak direla. Egoera horretan analisi konputazionalean tratamendu praktiko bat nagusitzen da. Hau da, ahal dena egitea eskura dauden baliabideekin jokatuz. Hala ere, beti ez da horrelako planteamendu errealistarik izan.

Formalismo desberdinak definitu dira esaldien sintaxia eta semantika lantzeko, biak paraleloan landuz edo bata bestearen menpe. esaldi-zatiak interpretatzeko ahalmenarekin edo gabe

  • Klasikoki eta batez ere giro akademikoetan esaldi osoaren analisi sintaktiko osoa eta esaldiaren esanahi osoa lortu nahi izan da automatikoki.
  • Beste sistema batzuek esaldi osoak ulertu ordez, helburu xumeago bat dute: testuko zenbait gramatika-erlazio solte harrapatu eta interpretatu semantikoki.
  • Gramatika semantikoek ohiko testuinguru rik gabeko gramatikak erabiltzen dituzte, baina erregeletan osagai sintaktikoak eta semantikoak maila berean konbinatuz.
  • Patroi-ezagutzan oinarritzen diren sistemetan testu luzeetan osaketa oso zehatzak dituzten esaldiak edo elementu sintaktikoak bilatzen dituzte. Patroien bidez definitzen dituzte bilatu nahi dituzten egitura horiek. Egitura horietarako interpretazioa sakon egiten dute, baina beste esaldietarako ezer gutxi. Galderak erantzuteko sistemetan erabili ohi dira horrelako sistemak.
  • Semantikak gidatutako analisia egiten dituzten inplementazioetan, tresna sintaktiko partzialak semantikak behar dituen testu zatiak bilatzeko erabiltzen dira bakarrik. Adibidez: Zein da perpauseko aditza? Aditzak gobernatzen duen subjektuaren izena zein da?

Esaldi bat modu automatikoan prozesatu nahi dugunean, tratamendu semantikoaren helburua esaldiaren esanahia lortzea da, hau da, bere edukiaren errepresentazio kontzeptuala sortzea. Horretan, esaldiaren esanahia egitura formal baten bidez adierazi beharko da, eta horrelako adierazpideei esanahi-adierazpide deituko diegu. Ezagutza adierazteko modua fonologian, morfologian, eta sintaxian garrantzizko papera bazuen tratamendu semantikoan are garrantzitsuagoa da; semantikaren kasuan adierazpideak ezagutza linguistikoaz gain ezagutza ez‑linguistikoa ere landu behar delako, bi ezagutza mota bien arteko zubi-lana egin behar du semantikak, eguneroko jardueran hizkuntzaren bidez erabiltzen dugun munduari buruzko ezagutza errepresentatzea eta erabiltzea ezinbesteko baita gure hizkuntzako benetako esaldiak ulertzeko. Zenbait adierazpide definitu dira perpausen informazio semantikoa eta sintaktikoa modu integratuan adierazteko.

Hala ere, semantika konputazionala izeneko atal honetan analisi semantikoaz hitz egingo dugunean, era mugatuago batean erabiliko dugu, alegia, testuingurutik independente den esanahi‑adierazpideaz hitz egingo dugu. Baina, posible al da hitz egitea esaldiaren esanahiari buruz bere testuingurua kontuan hartu gabe? Ematen du badirela esanahi-aspektu batzuk testuingurutik independenteak direnak, hala nola, hitzen adiera desberdinak bereiztea (bai objektuetan, bai ekintza edo gertaeretan ere), edo nolakoa den esaldi barruko hitzen arteko eragina beren esanahiak elkarri murrizteko. Hemen, horretaz mintzatuko gara, hau da, testuingurutik (aurreko esaldiak edo hizketa-gaia) independente den esaldien esanahiaz arituko gara. Hurbilpen teorikoak behar dira helburu hori ganoraz lantzeko, eta orain arte egin den proposamen formalena James Allen-ek “Natural Language Understanding” liburuan proposatutakoa da. perpausen esanahia errepresentatzeko forma logikoa deitzen duena definitzen du bertan.

Semantikarako baliabideak eta tresnak


Oinarrizko kontzeptuak

lanaren aipamena nola egin...

Euskara Institutua, EHU, "Semantika", Sareko Euskal Gramatika (SEG), www.ehu.eus/seg
ISBN: 978-84-693-9891-3