Materia
Introducción al Aprendizaje Automático
Datos generales de la materia
- Modalidad
- Presencial
- Idioma
- Inglés
Descripción y contextualización de la asignatura
Una introducción a los principios y técnicas estadísticas básicas usadas en el procesamiento del lenguaje natural. Estudiaremos aspectos en el área de la estadística descriptiva. También introduciremos técnicas de aprendizaje automático, incluidos el procesamiento básico de datos y los principales algoritmos de aprendizaje.Profesorado
Nombre | Institución | Categoría | Doctor/a | Perfil docente | Área | |
---|---|---|---|---|---|---|
ARBELAIZ GALLEGO, OLATZ | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Pleno | Doctora | Bilingüe | Arquitectura y Tecnología de Computadores | olatz.arbelaitz@ehu.eus |
PEREZ RAMIREZ, ALICIA | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctora | Bilingüe | Lenguajes y Sistemas Informáticos | alicia.perez@ehu.eus |
Competencias
Denominación | Peso |
---|---|
Capacidad de comprender y aplicar las medidas estadísticas básicas para la descripción de características en un conjunto de datos. | 35.0 % |
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano. | 25.0 % |
Capacidad de aplicar algoritmos clásicos para la resolución de problemas de PLN. | 40.0 % |
Tipos de docencia
Tipo | Horas presenciales | Horas no presenciales | Horas totales |
---|---|---|---|
Magistral | 10 | 15 | 25 |
P. Ordenador | 20 | 30 | 50 |
Actividades formativas
Denominación | Horas | Porcentaje de presencialidad |
---|---|---|
Clases magistrales | 25.0 | 40 % |
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas | 50.0 | 40 % |
Sistemas de evaluación
Denominación | Ponderación mínima | Ponderación máxima |
---|---|---|
Asistencia y Participación | 10.0 % | 10.0 % |
Examen escrito | 30.0 % | 60.0 % |
Trabajos Prácticos | 30.0 % | 60.0 % |
Resultados del aprendizaje de la asignatura
Extraer las características más importantes de variables estadísticas, como pueden ser medidas de tendencia central, dispersión y correlación, tanto para variables cuantitativas como cualitativas.Conocer el funcionamiento de los algoritmos de clasificación para poder aplicar el más adecuado a cada problema.
Conocer el preprocesamiento adecuado de los datos de entrada para plantear y poder resolver adecuadamente el problema de clasificación.
Aprender a utilizar software específico para la clasificación de tareas de procesamiento de lenguaje natural.
Temario
1. Medidas básicas estadísticas: Mean, Standard deviation, Chi-square, Mutual information, Kappa, etc.2. Introducción al aprendizaje automático para el PLN
3. Algoritmos básicos en aprendizaje automático: Naive Bayes, K-NN, Decision trees, SVM...
4. Evaluación el aprendizaje supervisado
Bibliografía
Bibliografía básica
R.H. Baayen (2008)Analyzing Linguistic Data. A PracticalIntroduction to Statistics using R. Cambridge University Press
C.D. Manning, H. Sch utze (2003)Foundations of StatisticalNatural Language Processing. The MIT Press
Data Mining. Mark Hall, Ian Witten and Eibe Frank(4th Edition). TheMorgan Kaufmann, 2017.
Machine LearningforText. CharuC. Aggarwal. Springer, 2018
Text Mining with R. Julia Silgeeta David Robinson. O'Relly, 2017
Fundamentals of Predictive Text Mining (2nd Edition). Weiss, SholomM., Indurkhya, Nitin, Zhang, Tong. Springer-VerlagLondon, 2015