26227 - Hizkuntzaren Prozesamendua



  • Ikastegia: Informatika Fakultatea
  • Titulazioa: Informatikaren Ingeniaritzako Gradua
  • Ikasturtea: 2017/18
  • Maila: 4


IRAKASGAIAREN AZALPENA ETA TESTUINGURUA ZEHAZTEA

Irakasgai hau laugarren mailako bigarren lauhileko hautazkoa da, "Sistema Adimendunak" multzokoa. Esta asignatura es optativa del segundo cuatrimestre en cuarto curso, y pertence al grupode optativas "Sistemas Inteligentes". Presenta la Ingeniería Lingüística (procesamiento de la lengua, lenguaje natural o lenguaje humano) en sus tres vertientes:(1) métodos y herramientas básicas para análisis, recursos y formas de adquirirlos y, por último, aplicaciones.

El enfoque de la asignatura es básicamente práctico, precisa la utilización intensiva de ordenadores. Se examinan las grandes áreas de aplicación: ayudas para edición y gestión de textos, traducción automática, interfaces de interacción persona/máquina, tratamiento de voz y el procesamiento de grandes volúmenes de información textual.

El temario de la asignatura pretende cubrir las dos aproximaciones que normalmente se usan en las tareas de procesamiento del lenguaje natural: la aproximación basada en el conocimiento (básicamente lingüístico) y la aproximación basada en métodos empíricos (básicamente de tipo estadístico o de Aprendizaje Automático).

GAITASUNAK / IRAKASGAIA IKASTEAREN EMAITZAK

- Giza-lengoaiak (hizkuntzak) ordenagailu bidez tratatzeko dauden teknikak eta aplikazioak ezagutzea da irakasgaiaren helburu nagusia.
- Hizkuntz industrien barruan kokatzen diren aplikazioen artean honakoak sartzen dira: Testuen edizioa eta kudeaketa (zuzentzaile ortografikoak eta gramatikalak, hiztegi-laguntzak, testu eleanitzen tratamendua, informazio bilaketa eta eskurapena testu-masa handietan), itzulpen automatikoa, lengoaia naturaleko interfazeak eta ahozko hizkuntzaren tratamendua. Hizkuntzaren prozesamenduaren adibide arrkastatsu batzuk hemen
- Erakusten diren teknikak erabilitako ezagutza-motaren arabera azaltzen dira (lexikala, morfologikoa, sintaktikoa, semantikoa eta pragmatikoa).
- Batetik ezagutza linguistikoetan oinarritutako metodo sinbolikoak, eta bestetik estatistikan oinarritutako metodo enpirikoak, biak ikusiko dira.

EDUKI TEORIKO-PRAKTIKOAK

1. SARRERA.
(1.1)Zer da ulerkuntza? Hurbilketa desberdinak bere tratamenduan. (1.2)Lengoaiaren ulerkuntzarako arazoak. (1.3)Beharrezko diren ezagumendu-motak. (1.4)Analisiaren faseak eta beraien arteko koordinazioa. (1.5)Aplikazioak: Hizkuntza-industriak.
2. ANALISI MORFO-SINTAKTIKOA
3. INTERPRETAZIO SEMANTIKOA
4. TESTUINGURU-INTERPRETAZIOA ETA MUNDUAREKIKOA
5. ARRAZIONALISMO / ENPIRISMOA HIZKUNTZAREN PROZESAMENDUAN
6. HIZKUNTZ PRODUKTU INFORMATIKOAK: APLIKAZIOAK, TRESNAK ETA OINARRIAK

Metodologia

Astero izango da saio bat laborategian lan praktikoak egiteko, eta beste saio bat ikasgelan lan praktikoen oinarria emateko. Lan bibliografikoa hizkuntzaren teknologiaren aplikazioei buruz egingo da. Hainbat aplikazio, artikulu edo webgune proposatuko dira horien gainean.
Honako saioak burutuko dira laborategian: (1) Testu-ediziorako hizkuntz tresnak, (2) Analizatzaile morfologikoaren aplikazio erraz bat inplementatzea, (3)Lematizatzailea eta etiketatzaileak (4) Analizatzaile sintaktikoa, (5)Interpretatzaile semantikoa. (6)Produktu komertzialen aurkezpena eta erabilera. (7)Testuen gaineko tratamendu estatistikoak.

Irakaskuntza mota
Irakaskuntza mota M S GA GL GO GCL TA TI GCA
Ikasgelako eskola-orduak 40     20          
Ikaslearen ikasgelaz kanpoko jardueren orduak 60     30          

Ebaluazio-sistemak

  • AZKEN EBALUAZIOAREN SISTEMA
    • KALIFIKAZIOKO TRESNAK ETA EHUNEKOAK:

OHIKO DEIALDIA: ORIENTAZIOAK ETA UKO EGITEA:

Normalean: Laborategi-saioetako txostenak (%70) eta lan bibliografikoa eta aurkezpena (%30)
Laborategiko-saioetan egon ez direnek azterketa bat egin beharko dute: Azterketa (%40), laborategi-saioetako txostenak (%30) eta lan bibliografikoa eta aurkezpena (%30).

EZOHIKO DEIALDIA: ORIENTAZIOAK ETA UKO EGITEA

Idem.

Nahitaez erabili beharreko materiala

Moodle aplikazioaren bitartez zabaltzen direnak: Moodle, Hizkuntzaren Prozesamendua 2011-12
Gune irekia da hori, bisitari moduan ikus dezakezu.

Bibliografia

  • Oinarrizko bibliografia:

- Hizkuntzalaritza Konputazionala. Aldezabal I., Arriola J., Díaz de Ilarraza A., Sarasola K. Udako Euskal Unibertsitatea, Bilbo 2005. HIZTEK saila.
- Testu-analisirako PERL erremintak. Aitzol Astigarraga , Koldo Gojenola , Kepa Sarasola , Aitor Soroa. ISBN: 978-84-8438-233-1,Udako Euskal Unibertsitatea (UEU). Bilbo.
- Natural Language processing in Python. Steeven Bird, Ewan Klein and Edward Loper. Ariketa askorekin. Software libre eta irekia. Liburu librea.
- Natural Language Understanding. Allen, J. Second edition. Benjamin Cummings Publishing Company, 1995 Erreferentzi liburu nagusia programaren %60an jarraitua.
- Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Jurafsky D., Martin J. H. (2nd edition). Prentice Hall, 2008. Ahotsaren tratamendua ere sakonki lantzen du.
- Foundations of Statistical Natural Language Processing, Manning C. and Schütze H. MIT Press. Cambridge, MA: May 1999. Teknika estatistikoak sakonki lantzen du .
  • Gehiago sakontzeko bibliografia:

- Morfologia Konputazionala. Euskararen morfologiaren deskribapena Alegria I., Urkia M. Hizkuntza teknologia(Hiztek) graduondokoa UEU, Bilbo 2002. Morfologia konputazionaleko formalismoen panoramika. Bereziki Bi Mailatako formalismoa aztertzen du.
- Tecnologías del lenguaje. María Antonia Martí (Coordinadora), Juan Alberto Alonso, Toni Badia, Joan Campàs, Xavier Gómez, Julio Gonzalo, Joaquim Llisterri, Joaquim Rafel, Horacio Rodríguez, Joan Soler, María Felisa Verdejo. Editorial UOC 2003. Liburu orokorra eta gomendagarria.
- THE OXFORD HANDBOOK OF COMPUTATIONAL LINGUISTICS Mitkov R.(Ed). Oxford University Press. 2003. Hainbat aditukidatzitako artikuluez osatua.
- Statistical Machine Translation. Philipp Koehn, Cambridge University Press, 2010.
  • Interneteko helbide interesgarriak:

translate.google.com Erabiltzen duzu Googlek ematen duen `Traduzca esta página' aukera?
Opentrad.com Itzultzaile automatikoa espainieratik katalanera eta galiziera. Euskarara ere prototipo gisa.
EAMT elkartea Itzulpen automatikoko sistemak.
Ingelesez galdetu: Galdetu `How far is Bilbao from London?'
Hakia bilatzaile semantikoan bilatu Boston. zer bilatzen du Gallery atalean? Eta Usain Bolt bilatzen baduzu zer bilatzen du?
news.google.com Nola egiten dute berri-bilduma hori etengabe automatikoki eguneratuta mantentzeko?
yourdictionary.com 900 hiztegi kontsultagarri ingeleserako, 300 espainierarako,9 euskararako
hiztegia.net 50 hiztegi euskararako
Loquendo, Aholab,Nuance. Entzun konputagailuak nola irakurtzen dituen zuk idatzitako testua, hizketaren tratamendu automatikoa.
Ixa taldea Lengoaia Naturalaren Prozesamendua. Ikus bertako estekak.
Ixa Bloga teknologiako berria, dibulgazio mailan.
aclwiki ACL Lengoaia Naturalaren Prozesamenduko nazioarteko erakunderen wikia
SEPLN, Sociedad Española para el Tratamiento del Lenguaje Natural

Oharrak

Ez dago atal honi buruzko informaziorik
Azken aldaketaren data: 2017/02/28
Nodoa: liferay2.lgp.ehu.es