Materia

Contenido de XSL

Aplicaciones del PLN (II): Construcción de Sistemas de Extracción de Información, Búsqueda de Respuestas y Sistemas Conversacionales

Datos generales de la materia

Modalidad: Presencial
Idioma: Inglés

Descripción y contextualización de la asignatura

El objetivo de la asignatura es conocer y obtener la capacidad de implementar aplicaciones basadas en las tecnologías del lenguaje o procesamiento del lenguaje natural. Se estudiaran la aplicaciones básicas de PLN que en la actualidad se utilizan en la industria de la tecnologías del lenguaje.

El contenido se concentrara en las siguientes tareas:

i) Extracción de la información: Presentar técnicas avanzadas para la desambiguación del léxico en varios niveles lingüísticos. Las técnicas desambiguación incluyen algoritmos de desambiguación de sentido de palabras, entity linking, y reconocimiento y clasificación de entidades nombradas (NERC). Conocer e implementar algoritmos de extracción de información estructurada, así como la extracción de relaciones semánticas y extracción de eventos. Para ello, el alumno será capaz de utilizar técnicas avanzadas de Deep Learning (embeddings, transfer learning, LSTM, CNN, etc.), sequence labeling (inferencia, beam search, viterbi, etc.) y supervisión a distancia.

ii) Question Answering: Presentar técnicas no supervisadas (unsupervised learning) basadas en la similitud textual semántica (embeddings, teoria de grafos), y técnicas basadas en algoritmos supervisados que incluyen métodos end-to-end, recuperación de información, y recuperación de conocimiento. También se estudiarán técnicas de generación de lenguaje (p.e. modelos de lenguaje, seq2seq). Se estudiaran los últimos avances en tareas multimodales (e.g. visual question answering)

iii) Sistemas conversacionales: Presentar los módulos que conforman los sistemas conversacionales, y los algoritmos que controlan interacción del dialogo entre humanos y máquina. Se hará especial hincapié en el módulo de comprensión del lenguaje natural (NLU) así como la generación del lenguaje.

Profesorado

Nombre	Institución	Categoría	Doctor/a	Perfil docente	Área	Email
BARRENA MADINABEITIA, ANDER	Universidad del País Vasco/Euskal Herriko Unibertsitatea	Profesorado Adjunto (Ayudante Doctor/A)	Doctor	Bilingüe	Lenguajes y Sistemas Informáticos	ander.barrena@ehu.eus
LARRAÑAGA OLAGARAY, MIGUEL	Universidad del País Vasco/Euskal Herriko Unibertsitatea	Profesorado Agregado	Doctor	Bilingüe	Lenguajes y Sistemas Informáticos	mikel.larranaga@ehu.eus
LOPEZ DE LACALLE LECUONA, OIER	Universidad del País Vasco/Euskal Herriko Unibertsitatea	Profesorado Adjunto (Ayudante Doctor/A)	Doctor	Bilingüe	Lenguajes y Sistemas Informáticos	oier.lopezdelacalle@ehu.eus

Competencias

Denominación	Peso
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).	12.0 %
Conocimiento de utilización de las técnicas y recursos de ingeniería lingüística para aplicaciones reales de extracción de información, sistemas preguntas-respuestas, y sistemas conversacionales.	12.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.	12.0 %
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.	12.0 %
Habilidad para el manejo, adaptación y mejora de los métodos empíricos más relevantes para la investigación en las tecnologías de la lengua.	12.0 %
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos, etc.).	12.0 %
Capacidad para diseñar e implementar aplicaciones lingüísticos reales de extracción de información, preguntas-respuestas, y partes de sistemas conversacionales.	28.0 %

Tipos de docencia

Tipo	Horas presenciales	Horas no presenciales	Horas totales
Magistral	15	22.5	37.5
P. Ordenador	30	45	75

Actividades formativas

Denominación	Horas	Porcentaje de presencialidad
Clases magistrales	37.5	40 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas	75.0	40 %

Sistemas de evaluación

Denominación	Ponderación mínima	Ponderación máxima
Examen escrito	20.0 %	20.0 %
Exposiciones	20.0 %	20.0 %
OTROS	20.0 %	20.0 %
Trabajos Prácticos	40.0 %	40.0 %

Resultados del aprendizaje de la asignatura

Capacidad de implementar aplicaciones basadas en la tecnologías del lenguaje o procesamiento del lenguaje natural.

Conocimiento de la utilización de herramientas básicas del procesamiento del lenguaje natural.

Capacidad de utilizar y programar aplicaciones que utilizan métodos avanzados como Deep Learning y Machine Learning.

Capacidad de evaluación de aplicaciones NLP.

Convocatoria ordinaria: orientaciones y renuncia

1) El 25% de la calificación se basa en las tareas de clase: estas se realizarán típicamente en horas de clase y se entregarán utilizando e-gela. Al estudiante que entregue soluciones aproximadamente correctas a todas las tareas se le asignará crédito completo.

2) El 75% de la calificación corresponde a tres proyectos, cada uno relacionado con las tareas principales introducidas en el curso: cada alumno seleccionará o propondrá una asignatura para el proyecto a uno de los profesores, según sus intereses. Si un estudiante no propone ninguna asignatura, los profesores le asignarán una asignatura final del proyecto. El proyecto final se calificará en función de una presentación oral y un informe escrito, con los siguientes porcentajes:

- Informe 30%, incluyendo características como claridad, estructura, antecedentes, referencias, discusión

- Trabajo técnico 40%, que incluye características como la corrección y la profundidad del trabajo

- Presentación 30%, incluyendo claridad, estructura, discusión

Convocatoria extraordinaria: orientaciones y renuncia

En caso de que falten las tareas de clase o sean claramente deficientes, el estudiante será evaluado según los tres proyectos.

Temario

1. Introducción al NLP aplicado

2. Extracción de Información y técnicas de desambiguación.

3. Sistemas de Preguntas-Respuestas.

4. Sistemas conversacionales.

Bibliografía

Bibliografía básica

Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999.

Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition), Pearson. May, 2008.

Eneko Agirre, Phillip Edmonds (Eds.). Word Sense Disambiguation: Algorithms and applications, Springer. 2007

Yoav Goldberg, Graeme Hirst. Neural Network Methods in Natural Language Processing (Synthesis Lectures on Human Language Technologies). 2017. Primer. http://u.cs.biu.ac.il/~yogo/nnlp.pdf

ACL: https://aclweb.org/anthology/

Visualización del menú

Barra de búsqueda

Máster Erasmus Mundus en Tecnologías del Lenguaje y la Comunicación (LCT)

Materia

Contenido de XSL

Aplicaciones del PLN (II): Construcción de Sistemas de Extracción de Información, Búsqueda de Respuestas y Sistemas Conversacionales

Datos generales de la materia

Descripción y contextualización de la asignatura

Profesorado

Competencias

Tipos de docencia

Actividades formativas

Sistemas de evaluación

Resultados del aprendizaje de la asignatura

Convocatoria ordinaria: orientaciones y renuncia

Convocatoria extraordinaria: orientaciones y renuncia

Temario

Bibliografía

Bibliografía básica

Visualización del menú

Barra de búsqueda

Ruta de navegación

Materia

Contenido de XSL

Aplicaciones del PLN (II): Construcción de Sistemas de Extracción de Información, Búsqueda de Respuestas y Sistemas Conversacionales

Datos generales de la materia

Descripción y contextualización de la asignatura

Profesorado

Competencias

Tipos de docencia

Actividades formativas

Sistemas de evaluación

Resultados del aprendizaje de la asignatura

Convocatoria ordinaria: orientaciones y renuncia

Convocatoria extraordinaria: orientaciones y renuncia

Temario

Bibliografía

Bibliografía básica