Erabiltzaile Tresnak


hizk:1:3:2

Desanbiguatzaile morfosintaktikoa

Etiketatzaileak (tagger gisa ere ezagutzen den tresnak), analisi morfologiko posible guztiak lortzen ditu, baina testuinguruaren arabera egokia dena hautatu behar da, hau da, anbiguo dena desanbiguatu egin behar da aukera bakarra jasoaz, eta horretarako desanbiguatzaile morfosintaktikoa erabiltzen da. Horretarako teknika linguistikoak zein estatistikoak erabil daitezke.

Datuetan oinarritutako hurbilpenen artean Markov-en eredu ezkutuetan oinarritutako teknikak oso arrakastatsuak izan dira: hizkuntzaren prozesamenduaren hurbilpen estatistikoan eta ikasketa automatikoan mugarria izan dira. Gerora hainbat teknika erabili dira ataza honetarako: erabaki-zuhaitzak, SVM… Hurbilpen hauetan, eskuz desanbiguatutako corpus batetik programa bat gai da desanbiguatzen ikasteko.

Teknika linguistikoen artean murriztapen-gramatikak (Constraint Grammar) izan dira arrakastatsuenak lan honetarako. Gramatika hauetan hizkuntzalariek erregelak idazten dute testuinguru zehatzetan analisi posibleen artean bat hautatzeko edo baztertzeko.

Teknika multzo hauek konbinatu egin daitezke. Hain zuzen, hala jokatu zen Euslem euskal tresnan. Murriztapen-gramatika aplikatzen da aurrena, eta geratzen den anbiguotasuna sistema estatistiko baten bidez ebazten da.

Orokorrean tresna hauen doitasuna %96koa da, hau da, 100 hitzetatik 96 ondo analizatuta geratzen dira aukera bakarra utzi ondoren.

lanaren aipamena nola egin...

Euskara Institutua, EHU, "Desanbiguatzaile morfosintaktikoa", Sareko Euskal Gramatika (SEG), www.ehu.eus/seg
ISBN: 978-84-693-9891-3