Materia
Introducción a la Minería de Datos
Datos generales de la materia
- Modalidad
- Presencial
- Idioma
- Castellano
Descripción y contextualización de la asignatura
En la actualidad el progreso del conocimiento y el desarrollo de la tecnología se soportan en gran medida en la explotación de grandes cantidades de datos empíricos recogidos de todo tipo de mediciones. Las bases de datos facilitan el almacenamiento, actualización, ordenación y búsqueda de esos datos. La minería de datos, combina los recursos de la estadística y la computación para descubrir patrones de comportamiento en los datos, que generen nueva información relevante y que se pueda estructurar para su uso posterior. El proceso conlleva diferentes fases, tales como la selección y preprocesamiento de las variables, la aplicación de las técnicas relevantes, la validación y selección del mejor modelo y su interpretación.Profesorado
Nombre | Institución | Categoría | Doctor/a | Perfil docente | Área | |
---|---|---|---|---|---|---|
GORRIA CORRES, CARLOS | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctor | Bilingüe | Matemática Aplicada | carlos.gorria@ehu.eus |
ALCALA NALVAIZ, JOSE TOMAS | Universidad de Zaragoza | Profesorado Titular De Universidad | Doctor |
Competencias
Denominación | Peso |
---|---|
Conoce en qué consiste la minería de datos, los diversos tipos de problemas que resuelve y las diferentes técnicas que se utilizan. | 20.0 % |
Sabe analizar un conjunto grande de datos con dos o más de las técnicas presentadas durante el curso. | 20.0 % |
Sabe evaluar la capacidad predictiva de un modelo. | 20.0 % |
Sabe elegir entre distintos modelos el que mejor se adapta al problema que se desea resolver. | 20.0 % |
Sabe utilizar un software de minería de datos. | 20.0 % |
Tipos de docencia
Tipo | Horas presenciales | Horas no presenciales | Horas totales |
---|---|---|---|
Magistral | 24 | 36 | 60 |
Seminario | 4 | 12 | 16 |
P. de Aula | 8 | 18 | 26 |
P. Ordenador | 24 | 24 | 48 |
Actividades formativas
Denominación | Horas | Porcentaje de presencialidad |
---|---|---|
Análisis de casos | 10.0 | 0 % |
Clases magistrales | 24.0 | 100 % |
Debates | 6.0 | 25 % |
Ejercicios | 10.0 | 0 % |
Lecturas | 10.0 | 0 % |
Prácticas de aula | 14.0 | 25 % |
Prácticas de ordenador | 48.0 | 50 % |
Seminarios | 4.0 | 100 % |
Trabajo en grupo | 18.0 | 0 % |
Tutorías | 6.0 | 50 % |
Sistemas de evaluación
Denominación | Ponderación mínima | Ponderación máxima |
---|---|---|
Se valorará la asistencia y la respuesta a las actividades y ejercicios propuestos | 20.0 % | 40.0 % |
Trabajos Prácticos | 60.0 % | 80.0 % |
Convocatoria ordinaria: orientaciones y renuncia
CRITERIOS DE LA EVALUACIÓN CONTINUA:Realización de una tarea individual consistente en la aplicación de técnicas de aprendizaje de reglas de asociación o similar sobre un conjunto de datos: 20%
Una segunda tarea individual o por parejas donde se resuelve un problema de aprendizaje supervisado aplicando diversas técnicas y seleccionando el modelo más adecuado. Se debe entregar un informe que describa todo el proceso de trabajo y el código utilizado: 80%
Para aprobar la asignatura será necesario entregar ambas tareas y alcanzar una nota de 5 sobre 10 en la calificación conjunta de ambas tareas.
CRITERIOS DE LA EVALUACIÓN FINAL:
Los estudiantes que lo soliciten, podrán someterse a una evaluación final, que podrá consistir en una prueba única, o en un conjunto de pruebas y trabajos.
Se podrá establecer de manera excepcional la asistencia a determinadas sesiones presenciales, y la superación, en su caso, de las pruebas que en ellas se establezcan.
Los estudiantes deberán solicitar la evaluación diferenciada mediante escrito razonado dirigido al Coordinador del Máster, desde el momento de la matrícula hasta transcurridos, como máximo, cinco días desde el inicio del curso. La solicitud se acompañará de todos los documentos que acrediten la imposibilidad de seguir con normalidad el desarrollo del curso. La Comisión Académica del Máster, resolverá en el plazo máximo de veinte días.
RENUNCIA:
El alumnado que haya realizado sólo parte de las tareas asignadas a lo largo del curso, será calificado como No presentado/a.
Convocatoria extraordinaria: orientaciones y renuncia
Los criterios de evaluación serán los mismos que en la convocatoria ordinaria. La evaluación de las actividades realizadas a lo largo del curso (prácticas de ordenador, ejercicios, seminarios) será válida para las dos convocatorias del curso. En consecuencia, el alumnado que haya superado estas actividades a lo largo del curso, en la convocatoria extraordinaria solo tendrá que presentarse al trabajo individual. En el caso del alumnado que no haya superado la evaluación de dichas actividades o haya elegido la modalidad de evaluación final, en la convocatoria extraordinaria deberá realizar, también, una prueba complementaria diseñada para la evaluación de las actividades realizadas a lo largo del curso. Dicha prueba puede consistir en una exposición oral, una demostración ante un ordenador o una descripción escrita de los conocimientos prácticos abordados en las actividades planteadas a lo largo del curso.Temario
- Introducción a la minería de datos.- Aprendizaje Supervisado:
Modelos Predictivos: Lineal y regularizado. Modelos No Paraméticos.
Modelos de clasificación: Análisis Discriminante, Regresión Logística, k vecinos próximos, máquinas de Vector Soporte y Modelo Naïve-Bayes.
Árboles de Regresión y de Clasificación.
Introducción a métodos de clasificación por consenso (Bagging, Random Forest y Boosting)
Introducción a los Modelos gráficos probabilísticos: Redes bayesianas.
- Análisis de Conjuntos de Items Frecuentes (Análisis de reglas de asociación)
- Elementos básicos de Minería de Textos
Bibliografía
Materiales de uso obligatorio
Apuntes y prácticas de la asignatura "Introducción a la Minería de Datos" publicados en la plataforma virtual de apoyo a la docencia de la Universidad.Bibliografía básica
.Bibliografía de profundización
• C.M. Bishop, Pattern Recognition and Machine Learning, Springer. (2006)• T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning. Data mining, Inference and Prediction, Springer. (2001),
• L. Torgo, Data Mining with R: Learning with Case Studies. Chapman and Hall/ CRC, (2011)
• G. Willians, Data Minig with Rattle and R. Springer, (2011)
• I.H. Witten, E. Frank, Data Mining Practical Machine Learning Tools and Techniques (Second Edition), Morgan Kaufmann. (2005)
Revistas
• http://www.jmlr.org/Enlaces
• https://www.r-project.org/• https://www.cs.waikato.ac.nz/ml/weka/
• https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf
• http://www.cs.cmu.edu/~tom/pubs/MachineLearning.pdf