Materia

Contenido de XSL

Introducción al Aprendizaje Automático

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

Una introducción a los principios y técnicas estadísticas básicas usadas en el procesamiento del lenguaje natural. Estudiaremos aspectos en el área de la estadística descriptiva. También introduciremos técnicas de aprendizaje automático, incluidos el procesamiento básico de datos y los principales algoritmos de aprendizaje.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
ARBELAIZ GALLEGO, OLATZUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeArquitectura y Tecnología de Computadoresolatz.arbelaitz@ehu.eus
PEREZ RAMIREZ, ALICIAUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeLenguajes y Sistemas Informáticosalicia.perez@ehu.eus

Competencias

DenominaciónPeso
Capacidad de comprender y aplicar las medidas estadísticas básicas para la descripción de características en un conjunto de datos.35.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.25.0 %
Capacidad de aplicar algoritmos clásicos para la resolución de problemas de PLN.40.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral101525
P. Ordenador203050

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Clases magistrales25.040 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas50.040 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Asistencia y Participación10.0 % 10.0 %
Examen escrito30.0 % 60.0 %
Trabajos Prácticos30.0 % 60.0 %

Resultados del aprendizaje de la asignatura

Extraer las características más importantes de variables estadísticas, como pueden ser medidas de tendencia central, dispersión y correlación, tanto para variables cuantitativas como cualitativas.

Conocer el funcionamiento de los algoritmos de clasificación para poder aplicar el más adecuado a cada problema.

Conocer el preprocesamiento adecuado de los datos de entrada para plantear y poder resolver adecuadamente el problema de clasificación.

Aprender a utilizar software específico para la clasificación de tareas de procesamiento de lenguaje natural.

Temario

1. Medidas básicas estadísticas: Mean, Standard deviation, Chi-square, Mutual information, Kappa, etc.

2. Introducción al aprendizaje automático para el PLN

3. Algoritmos básicos en aprendizaje automático: Naive Bayes, K-NN, Decision trees, SVM...

4. Evaluación el aprendizaje supervisado

Bibliografía

Bibliografía básica



R.H. Baayen (2008)Analyzing Linguistic Data. A PracticalIntroduction to Statistics using R. Cambridge University Press

C.D. Manning, H. Sch utze (2003)Foundations of StatisticalNatural Language Processing. The MIT Press

Data Mining. Mark Hall, Ian Witten and Eibe Frank(4th Edition). TheMorgan Kaufmann, 2017.

Machine LearningforText. CharuC. Aggarwal. Springer, 2018

Text Mining with R. Julia Silgeeta David Robinson. O'Relly, 2017

Fundamentals of Predictive Text Mining (2nd Edition). Weiss, SholomM., Indurkhya, Nitin, Zhang, Tong. Springer-VerlagLondon, 2015