Contenido de XSL

Minería de Datos

Centro
Escuela de Ingeniería de Bilbao
Titulación
Grado en Ingeniería Informática de Gestión y Sistemas de Información
Curso académico
2023/24
Curso
4
Nº Créditos
6
Idiomas
Castellano

DocenciaAlternar navegación

Distribución de horas por tipo de enseñanza
Tipo de docenciaHoras de docencia presencialHoras de actividad no presencial del alumno/a
Magistral3045
P. Ordenador3045

Guía docenteAlternar navegación

ObjetivosAlternar navegación

COMPETENCIAS DE LA ASIGNATURA: A continuación se enumeran las competencias de la asignatura y para cada una de ellas se establecen asociaciones con las competencias del módulo al que pertenece esta asignatura y también con las competencias transversales del catálogo de la UPV/EHU (posteriormente se describen tanto las competencias de módulo como las transversales)



CA1: Reconocer los beneficios del uso sistemático de técnicas de extracción de conocimiento para la obtención de modelos y patrones predictivos o descriptivos. Competencias asociadas: M03CM02, M03CM04, CT8



CA2: Conocer las distintas técnicas de aprendizaje automático y estadísticas utilizadas en minería de datos, su potencial, su coste computacional y sus limitaciones de representación y de inteligibilidad. Competencias alineadas: M03CM01, M03CM05, CT3



CA3: Elegir, para un problema concreto, qué técnicas de minería de datos son más apropiadas. Competencias asociadas: M03CM03, M03CM06, CT8



CA4: Generar los modelos y patrones elegidos utilizando una herramienta o paquete de minería de datos. Competencias asociadas: M03CM05, CT3



CA5: Evaluar la calidad de un modelo, utilizando técnicas sencillas de evaluación. Competencias asociadas: M03CM05



CA6: Conocer la problemática especial de la minería sobre la web y las técnicas más usuales. Competencias asociadas: M03CM01, M03CM06, CT8







COMPETENCIAS ESPECÍFICAS del MÓDULO M03: Sistemas de Información:



M03CM01 - Capacidad para integrar soluciones de tecnologías de la información y comunicaciones y procesos empresariales para satisfacer las necesidades de información de las organizaciones de las organizaciones, permitiéndoles alcanzar sus objetivos de forma efectiva y eficiente, dándoles así ventajas competitivas



M03CM02 - Capacidad para determinar los requisitos de los sistemas de información y comunicación de una organización atendiendo a aspectos de seguridad y cumplimiento de la normativa y la legislación vigente.



M03CM03 - Capacidad para participar activamente en la especificación, diseño, implementación y mantenimiento de los sistemas de información y comunicación.



M03CM04 - Capacidad para comprender y aplicar los principios y prácticas de las organizaciones, de forma que puedan ejercer como enlace entre las comunidades técnica y de gestión de una organización y participar activamente en la formación de los usuarios.



M03CM05 - Capacidad para comprender y aplicar los principios de la evaluación de riesgos y aplicarlos correctamente en la elaboración y ejecución de planes de actuación.



M03CM06 - Capacidad para comprender y aplicar los principios y las técnicas de gestión de la calidad y de la innovación tecnológica en las organizaciones.







COMPETENCIAS TRANSVERSALES:

Competencias transversales que reúne el “Catálogo de Competencias Transversales de la UPV/EHU” (https://www.ehu.eus/es/web/enplegua/competencias-transversales) referenciadas, debajo, siguiendo la notación del catálogo referido. Concretamente:

CT3 Comunicación y Plurilingüismo. Saber comunicar y transmitir conocimientos, habilidades y destrezas correspondientes a un graduado en Ingeniería Informática de Gestión y Sistemas de Información.

CT8 Trabajo en Equipo. Acciones colaborativas y fomento de co-responsabilidad.







RESULTADOS DE APRENDIZAJE:



R1: Identificar fuentes de incertidumbre inherentes a los problemas de extracción de conocimiento en los contextos de Business Intelligence, analizar cuantitativamente datos disponibles y proponer soluciones adaptadas al marco de aplicación. Competencias alineadas: CA2, CA3, CA4, CA5, M03CM01, M03CM04.



R2: Diseño, implementación, documentación de sistemas de inferencia en entornos de aplicación reales en entornos de trabajo en grupo de forma eficaz. Competencias alineadas: CA1, CA2, CA3, CA6, M03CM03, M03CM02, CT8



RA3: Análisis de sensibilidad a la vista de resultados experimentales en la toma de decisiones con riesgo para esOmar el potencial de un sistema de minería de datos así como la comunicación de los resultados técnicos tanto de forma escrita como oral. Competencias alineadas: CA1, CA4, CA5, CA6, M03CM06, M03CM05, CT3





TemarioAlternar navegación

INTRODUCCIÓN:

· Objetivo. Contexto de aplicación.

· Aplicaciones comerciales: propensión/scoring, retención, venta cruzada, sistemas web, pronóstico y diagnóstico médico, aplicaciones industriales, procesamiento del lenguaje natural.

· Inteligencia artificial. Aprendizaje automático. Reconocimiento de formas.

· Aproximaciones a la minería de datos: Clasificación, Asociación, Clustering

· Datos: Recopilación de datos. Análisis.

· Pre-procesamiento: Selección de atributos. Introducción a los heurísticos de búsqueda y los algoritmos genéticos. Des-balance o cómo aprender con pocos datos.





TÉCNICAS EXPLORATORIAS: CLUSTERING

· Clasificación no-supervisada (clustering)

· Estudio de técnicas de clustering: clustering particional (k-means clustering); clustering probabilístico (algoritmo EM); clustering jerárquico (algoritmo aglomerativo); redes neuronales.

· Aplicaciones: Compresión de señal y teoría de la información; tendencias de clientes; detección de especies; mapa socio-lingüístico; web mining en artículos.





TÉCNICAS PREDICTIVAS: CLASIFICACIÓN

· Técnicas de evaluación y validación de clasificación supervisada

· Algoritmos de inferencia: neural networks, bayesian networks, random forest, logistic regression

· Combinación de clasificadores: meta-clasificadores (ensembles)

· Modelos multi-class mono-label vs. multi-class multi-label

· Aplicaciones: business intelligence, diagnóstico clínico





MetodologíaAlternar navegación

La asignatura es presencial.



La asignatura se desarrolla mediante tres tipos principales de actividades: clases magistrales de teoría, sesiones prácticas de ordenador y de trabajo y discusión. Todas las actividades requiren actitud pro-activa y pensamiento crítico. Se fomentan metodologías activas de enseñanza-aprendizaje.





Grupo de Ordenador: tienen como objetivo implementar en sistemas reales las técnicas trabajadas en las clases magistrales. Para adquirir diversas capacidades se fomenta el trabajo en equipo cooperativo y también se asume trabajo autónomo.

Sistemas de evaluaciónAlternar navegación

Convocatoria ordinaria:

· 60% Prácticas y trabajos: se obtiene mediante evaluación continua mediante diversas prácticas individuales y grupales.

· 40% Examen

Requisito: obtener un 40% de la ponderación correspondiente en cada una de las dos partes anteriores (Prácticas y trabajos, Examen).



Por defecto, se está adscrito a la "Evaluación continua", las competencias, en su aplicación y con el factor de ponderación descrito en términos de Prácticas y trabajos, se adquieren a lo largo del curso y se acreditan en los días establecidos en eGela para la modalidad de "Evaluación continua". Naturalmente, se puede renunciar a la evaluación continua y adscribirse a la "Evaluación Final" según lo establecido en la normativa y con. En caso de adscripción al sistema de “Evaluación Final”, se sigue el mismo criterio de evaluación que se ha establecido para la convocatoria extraordinaria.



Renuncia de los estudiantes a una convocatoria (Presentado vs. No Presentado):

- Presentado: si se presenta al examen de la asignatura en la convocatoria correspondiente, la mera asistencia es óbice para considerar presentado.

- No-Presentado: si no se presenta al examen de la asignatura en la convocatoria correspondiente

Materiales de uso obligatorioAlternar navegación

e-gela

BibliografíaAlternar navegación

Bibliografía básica

· E. Alpaydin. Introduction to Machine Learning. MIT Press, 2009



· Ian Witten, Eibe Frank, Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2006



· Murphy, K.P. (2012). Machine learning: a probabilistic perspective. MIT press.



· Kevin P. Murphy. Machine Learning: A Probabilistic Perspective. 2016





Bibliografía de profundización

· C.M. Bishop; Pattern Recognition and Machine Learning. Springer. (2006).

· Richard O. Duda, Peter E. Hart, David G. Stork; Pattern Classification; Ed. Wiley-Interscience; 2 ed ISBN-13: 978-0471056690

· S. Chakrabarti. Mining the Web: Discovering knowledge from hypertext. Morgan Kaufmann. 2003

· Jiawei Han & Micheline Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2006

· Pang-Ning Tan, Michael Steinbach & Vipin Kumar. Introduction to Data Mining. Addison-Wesley, 2006

· Tom Mitchell. Machine Learning. McGraw Hill, 1997.

Revistas

· ACM Transactions on KDD

· IEEE Transactions on Knowledge and Data Engineering

· Data Mining and Knowledge Discovery (DMKD)

· ACM SIGKDD Explorations

· Data & Knowledge Engineering (DKE)

Tribunal de convocatorias 5ª, 6ª y excepcionalAlternar navegación

  • ATUTXA SALAZAR, AITZIBER
  • GAINTZARAIN IBARMIA, JOSE
  • PEREZ RAMIREZ, ALICIA

GruposAlternar navegación

16 Teórico (Castellano - Tarde)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
1-1

17:00-19:00

1-14

15:00-17:00

Profesorado

Aula(s) impartición

  • P3I 10A - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P3I 10A - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II

16 P. Ordenador-1 (Castellano - Tarde)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
1-1

17:00-19:00

2-2

17:00-19:00

17:00-19:00

3-3

17:00-19:00

4-4

17:00-19:00

5-5

17:00-19:00

6-6

17:00-19:00

7-7

17:00-19:00

8-8

17:00-19:00

9-9

17:00-19:00

10-10

17:00-19:00

11-11

17:00-19:00

12-12

17:00-19:00

13-13

17:00-19:00

14-14

17:00-19:00

Profesorado

Aula(s) impartición

  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P6I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II

16 P. Ordenador-2 (Castellano - Tarde)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
1-1

19:00-21:00

2-2

19:00-21:00

19:00-21:00

3-3

19:00-21:00

4-4

19:00-21:00

5-5

19:00-21:00

6-6

19:00-21:00

7-7

19:00-21:00

8-9

19:00-21:00

10-10

19:00-21:00

11-11

19:00-21:00

12-12

19:00-21:00

13-13

19:00-21:00

14-14

19:00-21:00

Profesorado

Aula(s) impartición

  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P6I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 1L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II
  • P7I 7L - ESCUELA DE INGENIERIA DE BILBAO-EDIFICIO II