Materia
Procesamiento del Lenguaje Natural
Datos generales de la materia
- Modalidad
- Presencial
- Idioma
- Inglés
Descripción y contextualización de la asignatura
Este curso presentará las técnicas más utilizadas para crear aplicaciones basadas en Procesamiento del Lenguaje Natural (PLN). Los asistentes aprenderán cómo aplicar técnicas para la clasificación de documentos y etiquetado secuencial, así como representaciones vectoriales de palabras en modelos de lenguaje pre-entrenados para aplicaciones como Minería de Opiniones, Reconocimiento de entidades nombradas y Detección de noticias falsas. El curso tendrá un enfoque práctico consistente en laboratorios para aprender a usar herramientas ya disponibles (Spacy, Flair, Transformers, etc.) basadas en aprendizaje automático y profundo (deep learning) en un entorno multilingüe y multi-dominio. El objetivo es que los asistentes adquieran la autonomía necesaria para resolver problemas prácticos mediante la aplicación y desarrollo de aplicaciones basadas en PLN.Profesorado
Nombre | Institución | Categoría | Doctor/a | Perfil docente | Área | |
---|---|---|---|---|---|---|
AGERRI GASCON, RODRIGO | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Investigador Ramón Y Cajal | Doctor | No bilingüe | ** n o c o n s t a e l a r e a * ó " á r e a p r o v i s i o n a l" | rodrigo.agerri@ehu.eus |
ARREGI IPARRAGIRRE, PATXI XABIER | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctor | Bilingüe | Lenguajes y Sistemas Informáticos | xabier.arregi@ehu.eus |
Tipos de docencia
Tipo | Horas presenciales | Horas no presenciales | Horas totales |
---|---|---|---|
Magistral | 15 | 15 | 30 |
P. Ordenador | 15 | 30 | 45 |
Actividades formativas
Denominación | Horas | Porcentaje de presencialidad |
---|---|---|
Análisis de casos | 10.0 | 0 % |
Clases magistrales | 15.0 | 100 % |
Elaboración de trabajo | 20.0 | 0 % |
Prácticas de ordenador | 30.0 | 50 % |
Sistemas de evaluación
Denominación | Ponderación mínima | Ponderación máxima |
---|---|---|
Asistencia y Participación | 10.0 % | 10.0 % |
Ensayo, trabajo individual y/o en grupo | 40.0 % | 40.0 % |
Prácticas de ordenador | 50.0 % | 50.0 % |
Resultados del aprendizaje de la asignatura
.- Capacidad de usar, diseñar e investigar en aplicaciones de PLN basadas en clasificación de documentos y etiquetado secuencialbásico para varios idiomas (euskera, español, inglés...) y dominios (noticias, redes sociales...).
.- Identificar los recursos lingüísticos necesarios para adaptar aplicaciones de PLN.
.- Autonomía para la resolución de problemas prácticos mediante la aplicación de tecnología de PLN.
Temario
1. Introducción al PLN a través de casos de uso prácticos y aplicaciones.2. Clasificación de documentos multilingüe: Detección de sentimiento y noticias falsas (fake news) en noticias y redes sociales.
3. Etiquetado Secuencial: Reconocimiento de Entidades Nombradas, Análisis de Opiniones basado en Aspectos, Lematización Contextual.
4. Reformulación de tareas de etiquetado secuencial como pregunta-respuesta.
5. Argumentación y generación de textos.
Bibliografía
Bibliografía básica
D. Jurafsky and J.H. Martin. Speech and Language Processing, 3rd edition. https://web.stanford.edu/~jurafsky/slp3/ed3book_dec302020.pdfBing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers, 2012. https://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.html
Flair: A state of the art NLP framework (https://github.com/flairNLP/flair)
Spacy: Industrial Strength Natural Language Processing (https://spacy.io/)
Huggingface Transformers (https://huggingface.co/transformers/)
Natural Language Processing in Python (http://www.nltk.org/book)