Erabiltzaile Tresnak


hizk:1:4:14

Sintaxi Partziala

Sintaxi konputazionaleko analizatzaile sintaktikoek edo parserrek sorturiko analisien xehetasun edota sakontasun maila hizkuntzaren prozesamenduaren helburuaren mende dago. Esaterako, terminologia erauzketak makinak lagunduriko itzulpen automatikoan baliatzeko, nahikoa izango dute oinarrizko klausula-mugak zehaztearekin. Aldiz, testuen laburpen automatikoan esaldiak sailkatzeko ezinbestekoa izango da esaldien parsing osoa, nahiz eta ez izan erabatekoa. Bestalde, datu-baseei zuzenduriko galderak hizkuntza naturalean egiteko aplikatuko den parsingak interpretazio semantikoa ere ahalbideratuko du. Gaur egunean, oraindik orain, ez dago testu errealetako edozein esaldi osorik analizatuko duen analizatzailerik. Ingeleserako sortu da ahalmen zabaleko sistemarik, baina sistema horiek ere oztopo itzel baten aurrean aurkitzen dira bere emaitzak aplikatu nahi dutenean: emaitza posible bakarra ez, baizik eta dozenaka-edo analisi posible lortzen baitituzte testu errealetako perpaus arruntak analizatzerakoan. Gauzak horrela bi lerro nagusi bereizten dira sintaxi konputazionalean. Batetik, konputagailuaren laguntzaz hizkuntzaren deskribapen sakona lortzeko gero eta gramatika osatuagoak eraikitzea; bestetik, perpaus oso osoen analisia lortzeko asmorik gabe, zatiak (ingelesez chunk esaten duten horietakoak: izen sintagmak, adizlagunak, aditz kateak, …) bereizteko tresnak sortzea, tresna horiek hizkuntza teknologiako aplikazioak garatzeko baliagarriak izango direlako, hala nola, hizketa sorkuntzan, itzulpen automatikoan, informazio erauzketan, laburtze automatikoan, edo galdera-erantzunetako sistemetan. Azaleko sintaxia (shallow/light/partial parsing) parsing osoaren alternatiba bilakatu da. Nahiz eta, parsing osoak ematen duen informazio oso zehatza galdu, edozein testu libre analizatzeko erronkari aurre egiten dio eraginkortasunarekin eta fidagarritasunarekin, eta, horrezaz gainera, azaleko analisiek ematen duten informazio sintaktiko partziala baliagarri da hizkuntzaren prozesamenduko hainbat aplikaziotarako.

Sintaxi konputazionalekoikuspegi horri jarraituta zenbait ataza egiten dira: testuak chunketan zatitzea edota klausula-mugak identifikatzea, besteak beste. Zertan datza testua chunketan zatitzea? Zer dira chunk direlako horiek? Chunk terminoa Abney-ri zor zaio (Abney, 1991): sintagma kategoriako zatia da eta, sintaktikoki erlazionaturiko hitzez osatuta dago. Chunkaren barneko egitura aztertuz gero, burua eta bere modifikatzaileak bereiziko genituzke. Horrela bada, testua chunketan zatitzea gainjartzen ez diren eta elkarrekin sintaktikoki erlazionaturik dauden hitz multzoak atzematean datza. Hitz multzo horiek, beraz, ez-errekurtsiboak izango dira, hau da, ezin dute beren baitan beste hitz multzorik edo chunkik izan.

Ildo horretatik, azaleko sintaxiak hitzari zuzen-zuzenean loturiko egitura sintaktikoen berri emango digu. Esaldiaren chunkak/atalak/zatiak analizatzen ditu. Horretarako, esaldia gainjartzen ez diren zatietan banatuko da. Zati horietako hitz bakoitzak kategoria sintaktikoa izango du, eta horrez gain, zati bakoitzeko gunea ere adieraziko da. Zatien/chunken analisi hori esaldi osoaren oinarri izango da. Adibidez, “You will start to see shows where viewers program the program” esaldia honela zatituko genuke chunketan:

1. a. (NP You) (VP will start to see) (NP shows) (ADVP where) (NP viewers) (VP program) (NP the program)

Esaldi horretako klausulak hauek dira: (S You will start to see shows (S where (S viewers program the program))).

lanaren aipamena nola egin...

Euskara Institutua, EHU, "Sintaxi Partziala", Sareko Euskal Gramatika (SEG), www.ehu.eus/seg
ISBN: 978-84-693-9891-3