Materia

Contenido de XSL

Aplicaciones (I): Aproximación al PLN

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

El objetivo del curso es introducir el Procesamiento del Lenguaje Natural (PLN) a partir de aplicaciones ampliamente extendidas tanto en investigación como en la industria. El contenido constará de técnicas básicas de PLN: clasificación de documentos, técnicas que etiquetado secuencial para extraer opiniones, uso de representaciones vectoriales de palabras (word embeddings), normalización y pre-procesamiento de textos. Además, se analizará el papel de la traducción automática en el ámbito profesional y no profesional, atendiendo en particular al proceso de posedición. El curso tendrá un enfoque práctico basado en ejercicios mediante herramientas de software para el aprendizaje automático profundo (deep learning) utilizadas habitualmente en PLN.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
AGERRI GASCON, RODRIGOUniversidad del País Vasco/Euskal Herriko UnibertsitateaInvestigador Ramón Y CajalDoctorNo bilingüe** n o c o n s t a e l a r e a * ó " á r e a p r o v i s i o n a l"rodrigo.agerri@ehu.eus
ARANBERRI MONASTERIO, NORAUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeTraducción e Interpretaciónnora.aranberri@ehu.eus

Competencias

DenominaciónPeso
Capacidad de aplicar las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).33.0 %
Capacidad de comprensión de las características del lenguaje humano que hacen difícil su tratamiento automático.33.0 %
Capacidad de utilizar las aplicaciones existentes en el área de la tecnología de la lengua.33.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral101525
P. Laboratorio203050

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Clases magistrales25.040 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas50.040 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Examen escrito20.0 % 20.0 %
Exposiciones20.0 % 20.0 %
Portafolio20.0 % 20.0 %
Trabajos Prácticos40.0 % 40.0 %

Resultados del aprendizaje de la asignatura

Capacidad de usar, diseñar e investigar en aplicaciones de PLN basadas en clasificación de documentos y etiquetado secuencial básico para varios idiomas (euskera, español, inglés) y dominios (noticias, redes sociales).

Identificar los recursos lingüísticos necesarios para adaptar aplicaciones de PLN.

Aprender a usar de manera autónoma herramientas y librerías para el procesamiento de textos y traducción automática.

Capacidad de entender el rol de la post-edición en la aplicación de Traducción Automática.

Autonomía para la resolución de problemas prácticos mediante la aplicación de tecnología de PLN.

Temario

1. Introducción al PLN a través de casos de uso prácticos y aplicaciones (Traducción Automática, Análisis de Opiniones).

2. Clasificación de documentos multilingüe: Detección de sentimiento y noticias falsas (fake news) en noticias y redes sociales.

3. Etiquetado Secuencial para análisis de opiniones y de sentimientos.

4. La post-edición la evaluación de sistemas de Traducción Automática.

Bibliografía

Materiales de uso obligatorio

Bing Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers, 2012. https://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.html



Natural Language Processing in Python (http://www.nltk.org/book)

O¿Brien, S., Balling, L. W., Carl, M., Simar, M. and Specia, L. 2014. Post-editing of Machine Translation. Cambridge Scholars Publishing.