Materia

Contenido de XSL

Aplicaciones del PLN (II): Construcción de Sistemas de Extracción de Información, Búsqueda de Respuestas y Sistemas Conversacionales

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

El objetivo de la asignatura es conocer y obtener la capacidad de implementar aplicaciones basadas en las tecnologías del lenguaje o procesamiento del lenguaje natural. Se estudiaran la aplicaciones básicas de PLN que en la actualidad se utilizan en la industria de la tecnologías del lenguaje.

El contenido se concentrara en las siguientes tareas:

i) Extracción de la información: Presentar técnicas avanzadas para la desambiguación del léxico en varios niveles lingüísticos. Las técnicas desambiguación incluyen algoritmos de desambiguación de sentido de palabras, entity linking, y reconocimiento y clasificación de entidades nombradas (NERC). Conocer e implementar algoritmos de extracción de información estructurada, así como la extracción de relaciones semánticas y extracción de eventos. Para ello, el alumno será capaz de utilizar técnicas avanzadas de Deep Learning (embeddings, transfer learning, LSTM, CNN, etc.), sequence labeling (inferencia, beam search, viterbi, etc.) y supervisión a distancia.

ii) Question Answering: Presentar técnicas no supervisadas (unsupervised learning) basadas en la similitud textual semántica (embeddings, teoria de grafos), y técnicas basadas en algoritmos supervisados que incluyen métodos end-to-end, recuperación de información, y recuperación de conocimiento. También se estudiarán técnicas de generación de lenguaje (p.e. modelos de lenguaje, seq2seq). Se estudiaran los últimos avances en tareas multimodales (e.g. visual question answering)

iii) Sistemas conversacionales: Presentar los módulos que conforman los sistemas conversacionales, y los algoritmos que controlan interacción del dialogo entre humanos y máquina. Se hará especial hincapié en el módulo de comprensión del lenguaje natural (NLU) así como la generación del lenguaje.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
ALDEZABAL ROTETA, IZASKUNUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeFilología Vascaizaskun.aldezabal@ehu.eus
BARRENA MADINABEITIA, ANDERUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado Adjunto (Ayudante Doctor/A)DoctorBilingüeLenguajes y Sistemas Informáticosander.barrena@ehu.eus
GONZALEZ DIOS, ITZIARUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado Adjunto (Ayudante Doctor/A)DoctoraBilingüeFilología Vascaitziar.gonzalezd@ehu.eus
LARRAÑAGA OLAGARAY, MIGUELUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctorBilingüeLenguajes y Sistemas Informáticosmikel.larranaga@ehu.eus
LOPEZ DE LACALLE LECUONA, OIERUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado Adjunto (Ayudante Doctor/A)DoctorBilingüeLenguajes y Sistemas Informáticosoier.lopezdelacalle@ehu.eus

Competencias

DenominaciónPeso
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).12.0 %
Conocimiento de utilización de las técnicas y recursos de ingeniería lingüística para aplicaciones reales de extracción de información, sistemas preguntas-respuestas, y sistemas conversacionales.12.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.12.0 %
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.12.0 %
Habilidad para el manejo, adaptación y mejora de los métodos empíricos más relevantes para la investigación en las tecnologías de la lengua.12.0 %
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos, etc.).12.0 %
Capacidad para diseñar e implementar aplicaciones lingüísticos reales de extracción de información, preguntas-respuestas, y partes de sistemas conversacionales.28.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral1522.537.5
P. Laboratorio304575

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Clases magistrales37.540 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas75.040 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Examen escrito20.0 % 20.0 %
Exposiciones20.0 % 20.0 %
Otros20.0 % 20.0 %
Trabajos Prácticos40.0 % 40.0 %

Resultados del aprendizaje de la asignatura

Capacidad de implementar aplicaciones basadas en la tecnologías del lenguaje o procesamiento del lenguaje natural.

Conocimiento de la utilización de herramientas básicas del procesamiento del lenguaje natural.

Capacidad de utilizar y programar aplicaciones que utilizan métodos avanzados como Deep Learning y Machine Learning.

Capacidad de evaluación de aplicaciones NLP.

Convocatoria ordinaria: orientaciones y renuncia

1) El 25% de la calificación se basa en las tareas de clase: estas se realizarán típicamente en horas de clase y se entregarán utilizando e-gela. Al estudiante que entregue soluciones aproximadamente correctas a todas las tareas se le asignará crédito completo.

2) El 75% de la calificación corresponde a tres proyectos, cada uno relacionado con las tareas principales introducidas en el curso: cada alumno seleccionará o propondrá una asignatura para el proyecto a uno de los profesores, según sus intereses. Si un estudiante no propone ninguna asignatura, los profesores le asignarán una asignatura final del proyecto. El proyecto final se calificará en función de una presentación oral y un informe escrito, con los siguientes porcentajes:

- Informe 30%, incluyendo características como claridad, estructura, antecedentes, referencias, discusión

- Trabajo técnico 40%, que incluye características como la corrección y la profundidad del trabajo

- Presentación 30%, incluyendo claridad, estructura, discusión

Convocatoria extraordinaria: orientaciones y renuncia

En caso de que falten las tareas de clase o sean claramente deficientes, el estudiante será evaluado según los tres proyectos.

Temario

1. Introducción al NLP aplicado

2. Extracción de Información y técnicas de desambiguación.

3. Sistemas de Preguntas-Respuestas.

4. Sistemas conversacionales.

Bibliografía

Bibliografía básica

Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999.
Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition), Pearson. May, 2008.
Eneko Agirre, Phillip Edmonds (Eds.). Word Sense Disambiguation: Algorithms and applications, Springer. 2007
Yoav Goldberg, Graeme Hirst. Neural Network Methods in Natural Language Processing (Synthesis Lectures on Human Language Technologies). 2017. Primer. http://u.cs.biu.ac.il/~yogo/nnlp.pdf
ACL: https://aclweb.org/anthology/