Gaia
LNP Aplikazioak (II): Informazioaren Erauzketarako, Galderak Erantzuteko eta Hizketarako Sistemak Eraikitzen
Gaiari buruzko datu orokorrak
- Modalitatea
- Ikasgelakoa
- Hizkuntza
- Ingelesa
Irakasgaiaren azalpena eta testuingurua
El objetivo de la asignatura es conocer y obtener la capacidad de implementar aplicaciones basadas en las tecnologías del lenguaje o procesamiento del lenguaje natural. Se estudiaran la aplicaciones básicas de PLN que en la actualidad se utilizan en la industria de la tecnologías del lenguaje.El contenido se concentrara en las siguientes tareas:
i) Extracción de la información: Presentar técnicas avanzadas para la desambiguación del léxico en varios niveles lingüísticos. Las técnicas desambiguación incluyen algoritmos de desambiguación de sentido de palabras, entity linking, y reconocimiento y clasificación de entidades nombradas (NERC). Conocer e implementar algoritmos de extracción de información estructurada, así como la extracción de relaciones semánticas y extracción de eventos. Para ello, el alumno será capaz de utilizar técnicas avanzadas de Deep Learning (embeddings, transfer learning, LSTM, CNN, etc.), sequence labeling (inferencia, beam search, viterbi, etc.) y supervisión a distancia.
ii) Question Answering: Presentar técnicas no supervisadas (unsupervised learning) basadas en la similitud textual semántica (embeddings, teoria de grafos), y técnicas basadas en algoritmos supervisados que incluyen métodos end-to-end, recuperación de información, y recuperación de conocimiento. También se estudiarán técnicas de generación de lenguaje (p.e. modelos de lenguaje, seq2seq). Se estudiaran los últimos avances en tareas multimodales (e.g. visual question answering)
iii) Sistemas conversacionales: Presentar los módulos que conforman los sistemas conversacionales, y los algoritmos que controlan interacción del dialogo entre humanos y máquina. Se hará especial hincapié en el módulo de comprensión del lenguaje natural (NLU) así como la generación del lenguaje.
Irakasleak
Izena | Erakundea | Kategoria | Doktorea | Irakaskuntza-profila | Arloa | Helbide elektronikoa |
---|---|---|---|---|---|---|
BARRENA MADINABEITIA, ANDER | Euskal Herriko Unibertsitatea | Irakaslego Atxikia (Laguntzaile Doktorea) | Doktorea | Elebiduna | Hizkuntza eta Sistema Informatikoak | ander.barrena@ehu.eus |
LARRAÑAGA OLAGARAY, MIGUEL | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebiduna | Hizkuntza eta Sistema Informatikoak | mikel.larranaga@ehu.eus |
LOPEZ DE LACALLE LECUONA, OIER | Euskal Herriko Unibertsitatea | Irakaslego Atxikia (Laguntzaile Doktorea) | Doktorea | Elebiduna | Hizkuntza eta Sistema Informatikoak | oier.lopezdelacalle@ehu.eus |
Gaitasunak
Izena | Pisua |
---|---|
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos). | 12.0 % |
Conocimiento de utilización de las técnicas y recursos de ingeniería lingüística para aplicaciones reales de extracción de información, sistemas preguntas-respuestas, y sistemas conversacionales. | 12.0 % |
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano. | 12.0 % |
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano. | 12.0 % |
Habilidad para el manejo, adaptación y mejora de los métodos empíricos más relevantes para la investigación en las tecnologías de la lengua. | 12.0 % |
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos, etc.). | 12.0 % |
Capacidad para diseñar e implementar aplicaciones lingüísticos reales de extracción de información, preguntas-respuestas, y partes de sistemas conversacionales. | 28.0 % |
Irakaskuntza motak
Mota | Ikasgelako orduak | Ikasgelaz kanpoko orduak | Orduak guztira |
---|---|---|---|
Magistrala | 15 | 22.5 | 37.5 |
Ordenagailuko p. | 30 | 45 | 75 |
Irakaskuntza motak
Izena | Orduak | Ikasgelako orduen ehunekoa |
---|---|---|
Eskola magistralak | 37.5 | 40 % |
Ordenagailuko praktikak, irteerak, bisitak | 75.0 | 40 % |
Ebaluazio-sistemak
Izena | Gutxieneko ponderazioa | Gehieneko ponderazioa |
---|---|---|
Azalpenak | 20.0 % | 20.0 % |
Idatzizko azterketa | 20.0 % | 20.0 % |
Lan praktikoak | 40.0 % | 40.0 % |
OTROS | 20.0 % | 20.0 % |
Irakasgaia ikastean lortuko diren emaitzak
Capacidad de implementar aplicaciones basadas en la tecnologías del lenguaje o procesamiento del lenguaje natural.Conocimiento de la utilización de herramientas básicas del procesamiento del lenguaje natural.
Capacidad de utilizar y programar aplicaciones que utilizan métodos avanzados como Deep Learning y Machine Learning.
Capacidad de evaluación de aplicaciones NLP.
Ohiko deialdia: orientazioak eta uko egitea
1) 25% of the grading is based on class assignments: these will be typically performed in class hours, and will be handed in using e-gela. The student who hands-in approximately correct solutions to all assignments will be assigned full credit.2) 75% of the grading is on three projects, each related to main tasks introduced in the course: each student will select or propose a subject for the project to one of the lecturers, depending on his/her interests. If a student does not propose any subject, the lecturers will assign a final project subject to him/her. The final project will be graded based on an oral presentation and written report., with the following percentages:
- write-up 30%, including features like clarity, structure,background, references, discussion
- technical 40%, including features like correctness and depth ofthe work
- presentation 30%, including clarity, structure, discussion
Ezohiko deialdia: orientazioak eta uko egitea
In case the class assignments are missing or clearly deficient, the student will be evaluated depending on the three projects.Irakasgai-zerrenda
1. Introducción al NLP aplicado2. Extracción de Información y técnicas de desambiguación.
3. Sistemas de Preguntas-Respuestas.
4. Sistemas conversacionales.
Bibliografia
Oinarrizko bibliografia
Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999.Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition), Pearson. May, 2008.
Eneko Agirre, Phillip Edmonds (Eds.). Word Sense Disambiguation: Algorithms and applications, Springer. 2007
Yoav Goldberg, Graeme Hirst. Neural Network Methods in Natural Language Processing (Synthesis Lectures on Human Language Technologies). 2017. Primer. http://u.cs.biu.ac.il/~yogo/nnlp.pdf
ACL: https://aclweb.org/anthology/