Materia

Contenido de XSL

Introducción a la Minería de Datos

Datos generales de la materia

Modalidad
Presencial
Idioma
Castellano

Descripción y contextualización de la asignatura

En la actualidad el progreso del conocimiento y el desarrollo de la tecnología se soportan en gran medida en la explotación de grandes cantidades de datos empíricos recogidos de todo tipo de mediciones. Las bases de datos facilitan el almacenamiento, actualización, ordenación y búsqueda de esos datos. La minería de datos, combina los recursos de la estadística y la computación para descubrir patrones de comportamiento en los datos, que generen nueva información relevante y que se pueda estructurar para su uso posterior. El proceso conlleva diferentes fases, tales como la selección y preprocesamiento de las variables, la aplicación de las técnicas relevantes, la validación y selección del mejor modelo y su interpretación.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
GORRIA CORRES, CARLOSUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctorBilingüeMatemática Aplicadacarlos.gorria@ehu.eus
ALCALA NALVAIZ, JOSE TOMASUniversidad de ZaragozaProfesorado Titular De UniversidadDoctor

Competencias

DenominaciónPeso
Conoce en qué consiste la minería de datos, los diversos tipos de problemas que resuelve y las diferentes técnicas que se utilizan.20.0 %
Sabe analizar un conjunto grande de datos con dos o más de las técnicas presentadas durante el curso.20.0 %
Sabe evaluar la capacidad predictiva de un modelo.20.0 %
Sabe elegir entre distintos modelos el que mejor se adapta al problema que se desea resolver.20.0 %
Sabe utilizar un software de minería de datos.20.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral243660
Seminario41216
P. de Aula81826
P. Ordenador242448

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Análisis de casos10.00 %
Clases magistrales24.0100 %
Debates6.025 %
Ejercicios10.00 %
Lecturas10.00 %
Prácticas de aula14.025 %
Prácticas de ordenador48.050 %
Seminarios4.0100 %
Trabajo en grupo18.00 %
Tutorías6.050 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Se valorará la asistencia y la respuesta a las actividades y ejercicios propuestos20.0 % 40.0 %
Trabajos Prácticos60.0 % 80.0 %

Convocatoria ordinaria: orientaciones y renuncia

CRITERIOS DE LA EVALUACIÓN CONTINUA:

Realización de una tarea individual consistente en la aplicación de técnicas de aprendizaje de reglas de asociación o similar sobre un conjunto de datos: 20%

Una segunda tarea individual o por parejas donde se resuelve un problema de aprendizaje supervisado aplicando diversas técnicas y seleccionando el modelo más adecuado. Se debe entregar un informe que describa todo el proceso de trabajo y el código utilizado: 80%

Para aprobar la asignatura será necesario entregar ambas tareas y alcanzar una nota de 5 sobre 10 en la calificación conjunta de ambas tareas.

CRITERIOS DE LA EVALUACIÓN FINAL:

Los estudiantes que lo soliciten, podrán someterse a una evaluación final, que podrá consistir en una prueba única, o en un conjunto de pruebas y trabajos.

Se podrá establecer de manera excepcional la asistencia a determinadas sesiones presenciales, y la superación, en su caso, de las pruebas que en ellas se establezcan.

Los estudiantes deberán solicitar la evaluación diferenciada mediante escrito razonado dirigido al Coordinador del Máster, desde el momento de la matrícula hasta transcurridos, como máximo, cinco días desde el inicio del curso. La solicitud se acompañará de todos los documentos que acrediten la imposibilidad de seguir con normalidad el desarrollo del curso. La Comisión Académica del Máster, resolverá en el plazo máximo de veinte días.

RENUNCIA:

El alumnado que haya realizado sólo parte de las tareas asignadas a lo largo del curso, será calificado como No presentado/a.

Convocatoria extraordinaria: orientaciones y renuncia

Los criterios de evaluación serán los mismos que en la convocatoria ordinaria. La evaluación de las actividades realizadas a lo largo del curso (prácticas de ordenador, ejercicios, seminarios) será válida para las dos convocatorias del curso. En consecuencia, el alumnado que haya superado estas actividades a lo largo del curso, en la convocatoria extraordinaria solo tendrá que presentarse al trabajo individual. En el caso del alumnado que no haya superado la evaluación de dichas actividades o haya elegido la modalidad de evaluación final, en la convocatoria extraordinaria deberá realizar, también, una prueba complementaria diseñada para la evaluación de las actividades realizadas a lo largo del curso. Dicha prueba puede consistir en una exposición oral, una demostración ante un ordenador o una descripción escrita de los conocimientos prácticos abordados en las actividades planteadas a lo largo del curso.

Temario

- Introducción a la minería de datos.

- Aprendizaje Supervisado:

Modelos Predictivos: Lineal y regularizado. Modelos No Paraméticos.

Modelos de clasificación: Análisis Discriminante, Regresión Logística, k vecinos próximos, máquinas de Vector Soporte y Modelo Naïve-Bayes.

Árboles de Regresión y de Clasificación.

Introducción a métodos de clasificación por consenso (Bagging, Random Forest y Boosting)

Introducción a los Modelos gráficos probabilísticos: Redes bayesianas.

- Análisis de Conjuntos de Items Frecuentes (Análisis de reglas de asociación)

- Elementos básicos de Minería de Textos

Bibliografía

Materiales de uso obligatorio

Apuntes y prácticas de la asignatura "Introducción a la Minería de Datos" publicados en la plataforma virtual de apoyo a la docencia de la Universidad.

Bibliografía básica

.

Bibliografía de profundización

• C.M. Bishop, Pattern Recognition and Machine Learning, Springer. (2006)



• T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning. Data mining, Inference and Prediction, Springer. (2001),



• L. Torgo, Data Mining with R: Learning with Case Studies. Chapman and Hall/ CRC, (2011)



• G. Willians, Data Minig with Rattle and R. Springer, (2011)



• I.H. Witten, E. Frank, Data Mining Practical Machine Learning Tools and Techniques (Second Edition), Morgan Kaufmann. (2005)



Revistas

• http://www.jmlr.org/

Enlaces

• https://www.r-project.org/



• https://www.cs.waikato.ac.nz/ml/weka/



• https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf



• http://www.cs.cmu.edu/~tom/pubs/MachineLearning.pdf



Contenido de XSL

Sugerencias y solicitudes