Materia

Contenido de XSL

Aplicaciones (I): Aproximación al PLN

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

Este curso presentará las técnicas más utilizadas para crear aplicaciones basadas en Procesamiento del Lenguaje Natural (PLN). Los asistentes aprenderán cómo aplicar técnicas para la clasificación de documentos y etiquetado secuencial, así como representaciones vectoriales de palabras en modelos de lenguaje pre-entrenados para aplicaciones como Minería de Opiniones, Reconocimiento de entidades nombradas y Detección de noticias falsas.

El curso tendrá un enfoque práctico consistente en laboratorios para aprender a usar herramientas ya disponibles (Spacy, Flair, Transformers, etc.) basadas ​​en aprendizaje automático y profundo (deep learning) en un entorno multilingüe y multi-dominio. El objetivo es que los asistentes adquieran la autonomía necesaria para resolver problemas prácticos mediante la aplicación y desarrollo de aplicaciones basadas en PLN.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
AGERRI GASCON, RODRIGOUniversidad del País Vasco/Euskal Herriko UnibertsitateaInvestigador Ramón Y CajalDoctorNo bilingüe** n o c o n s t a e l a r e a * ó " á r e a p r o v i s i o n a l"rodrigo.agerri@ehu.eus

Competencias

DenominaciónPeso
Capacidad de aplicar las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).20.0 %
Capacidad de comprensión de las características del lenguaje humano que hacen difícil su tratamiento automático.20.0 %
Capacidad de utilizar las aplicaciones existentes en el área de la tecnología de la lengua.20.0 %
Capacidad de investigar en el diseño de sistemas de procesamiento de lenguaje.20.0 %
Capacidad de relacionar los métodos empíricos más relevantes para la investigación en las tecnologías de la lengua20.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral101525
P. Ordenador203050

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Clases magistrales25.040 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas50.040 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Examen escrito (problemas)20.0 % 20.0 %
Exposiciones20.0 % 20.0 %
Portafolio20.0 % 20.0 %
Trabajos Prácticos40.0 % 40.0 %

Resultados del aprendizaje de la asignatura

Capacidad de usar, diseñar e investigar en aplicaciones de PLN basadas en clasificación de documentos y etiquetado secuencial básico para varios idiomas (euskera, español, inglés) y dominios (noticias, redes sociales, etc.).



Identificar los recursos lingüísticos necesarios para adaptar aplicaciones de PLN.



Autonomía para la resolución de problemas prácticos mediante la aplicación de tecnología de PLN.

Convocatoria ordinaria: orientaciones y renuncia

La evaluación ordinaria se realizará mediante evaluación continua siguiendo los indicadores expuestos. Para renunciar a la asignatura los estudiantes deberán ponerse en contacto con la dirección del máster.

Convocatoria extraordinaria: orientaciones y renuncia

La evaluación extraordinaria consistirá en un prueba escrita (80%) y un trabajo individual (20%) que cubra el temario de la asignatura.

Temario

1. Introducción al PLN a través de casos de uso prácticos y aplicaciones.

2. Clasificación de documentos multilingüe: Detección de sentimiento y noticias falsas (fake news) en noticias y redes sociales.

3. Etiquetado Secuencial: Reconocimiento de Entidades Nombradas, Análisis de Opiniones basado en Aspectos, Lematización Contextual.

4. Reformulación de tareas de etiquetado secuencial.

Bibliografía

Materiales de uso obligatorio

Bing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers, 2012. https://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.html







Natural Language Processing in Python (http://www.nltk.org/book)



O¿Brien, S., Balling, L. W., Carl, M., Simar, M. and Specia, L. 2014. Post-editing of Machine Translation. Cambridge Scholars Publishing.



Bibliografía básica

D. Jurafsky and J.H. Martin. Speech and Language Processing, 3rd edition. https://web.stanford.edu/~jurafsky/slp3/ed3book_dec302020.pdf

Bing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers, 2012. https://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.html



Flair: A state of the art NLP framework (https://github.com/flairNLP/flair)



Spacy: Industrial Strength Natural Language Processing (https://spacy.io/)



Huggingface Transformers (https://huggingface.co/transformers/)



Natural Language Processing in Python (http://www.nltk.org/book)

Contenido de XSL

Sugerencias y solicitudes