Materia
Exploración y análisis de datos
Datos generales de la materia
- Modalidad
- Presencial
- Idioma
- Castellano
Descripción y contextualización de la asignatura
Según avanza la tecnología para la captura y el almacenamiento de datos de todo tipo, la acumulación de datos se hace más intensa. Explorar este conjunto de datos, y analizarlo, para extraer las informaciones útiles es una tarea primordial en cualquier área de conocimiento en el que se aplique el método de recogida de datos, como pueden ser la búsqueda de conocimiento en bases de datos, los sistemas de ayuda a la decisión, el análisis lingüístico, la segmentación de imágenes, el análisis de señales, el reconocimiento de voces, la identificación de secuencias de ADN, etc.El tipo de información de entrada que va a ser tratado mediante las técnicas que se presentan en la asignatura, se basa en ejemplos cuya representación es del tipo objeto-variable-valor, que es la más habitual. El análisis de las variables reflejadas en los ejemplos conduce a inducir estructuras con el fin de aplicarlas a nuevos ejemplos.
Dichas técnicas se engloban en lo que se denomina actualmente `data mining¿ (`minería de datos¿), y que de forma más explícita se refiere a la exploración y análisis de datos. Otras denominaciones que responden parcialmente al mismo conjunto de técnicas, son los de análisis multivariante, descubrimiento de conocimiento (`knowledge discovery¿), aprendizaje automático (`machine learning¿), o reconocimiento de patrones (`pattern recognition¿).
Los métodos de análisis de datos se fundamentan en métodos estadísticos, y sus técnicas en el desarrollo progresivo de los instrumentos de computación. Estamos así ante una asignatura que está en la bisagra de la computación y la estadística. Las técnicas se conciben dependiendo de la herramienta de cálculo disponible.
Profesorado
Nombre | Institución | Categoría | Doctor/a | Perfil docente | Área | |
---|---|---|---|---|---|---|
IRIGOYEN GARBIZU, ITZIAR | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctora | Bilingüe | Ciencia de la Computación e Inteligencia Artificial | itziar.irigoien@ehu.eus |
MORI CARRASCAL, USUE | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctora | Bilingüe | Ciencia de la Computación e Inteligencia Artificial | usue.mori@ehu.eus |
Competencias
Denominación | Peso |
---|---|
Conocer los principios teóricos y los fundamentos avanzados de la computación estadística, numérica y gráfica, de los sistemas basados en la inteligencia artificial, y de la representación de la información. | 33.0 % |
Saber aplicar los fundamentos y avances en computación estadística, numérica y gráfica, en sistemas basados en la inteligencia artificial, y en la representación de la información, para desarrollar sistemas, servicios y aplicaciones informáticas innovadoras, definiendo, evaluando y seleccionando plataformas hardware y software adecuadas. | 33.0 % |
Ser capaz de crear nuevos algoritmos y modelos de computación estadística, numérica y gráfica, nuevos paradigmas de inteligencia artificial y nuevas técnicas de representación de la información, analizando su complejidad computacional, demostrando su validez y obteniendo desarrollos tecnológicos. | 33.0 % |
Tipos de docencia
Tipo | Horas presenciales | Horas no presenciales | Horas totales |
---|---|---|---|
Magistral | 30 | 45 | 75 |
Seminario | 10 | 15 | 25 |
P. Ordenador | 20 | 30 | 50 |
Actividades formativas
Denominación | Horas | Porcentaje de presencialidad |
---|---|---|
Actividades propuestas por el equipo docente a través de la plataforma virtual | 0.0 | 0 % |
Clases expositivas | 20.0 | 100 % |
Elaboración de informes y exposiciones | 30.0 | 30 % |
Estudio sistematizado | 40.0 | 0 % |
Horas de contacto virtual a través de la plataforma (participación en foros, consulta de dudas, etc) | 0.0 | 100 % |
Interacción con el docente en entornos virtuales | 0.0 | 30 % |
Lectura y análisis prácticos | 40.0 | 50 % |
Talleres de aplicación | 20.0 | 100 % |
Videoconferencias | 0.0 | 100 % |
Sistemas de evaluación
Denominación | Ponderación mínima | Ponderación máxima |
---|---|---|
Asistencia y Participación | 15.0 % | 25.0 % |
Exposiciones | 30.0 % | 40.0 % |
OTROS | 0.0 % | 10.0 % |
Participación en los foros | 15.0 % | 25.0 % |
Pruebas de evaluación a distancia | 75.0 % | 85.0 % |
Trabajos Prácticos | 30.0 % | 40.0 % |
Temario
Introducción general a la problemática y nociones básicasVisualización de una variable y de las relaciones entre variables
Métodos de clasificación no supervisada
Métodos de clasificación supervisada
Métodos de reducción de la dimensionalidad (factoriales)
Combinación de métodos
Bibliografía
Bibliografía básica
HAND, D., MANNILA, H., SMYTH, P., `Principles of Data Mining¿, MIT Press, 2001.LEBART L., PIRON M., MORINEAU A., `Statistique exploratoire multidimensionnelle¿, Dunod, 4eme édition, 2006.
HASTIE T., TIBSHIRANI R., FRIEDMAN J., `The Elements of Statistical Learning: Data Mining, Inference, and Prediction¿, Springer Verlag, 2001.
MYATT G.J., `Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data Mining¿, John Wiley, 2006.
Bibliografía de profundización
ANDERBERG M.R., `Cluster analysis for applications¿, Academic Press, New York, 1973.HARTIGAN J., `Clustering Algorithms¿, Wiley, 1975,
BREIMAN L., FRIEDMAN J., OLSHEN R., STONE C., `Classification and Regression Trees¿, Wadsworth and Brooks, Monterrey CA, 1984.
QUINLAN J.R, `C4.5: Programs for Machine Learning¿, Morgan Kaufmann, 1992
FAYYAD U., PIATETSKY-SHAPIRO G., SMYTH P., UTHURUSAMY R., (eds.), `Advances in Knowledge Discovery and Data Mining¿, AAAI/MIT Press, 1996.
D. MICHIE, D.J. SPIEGELHALTER, C.C. TAYLOR, (eds), `Machine Learning, Neural and Statistical Classification¿ http://www.amsta.leeds.ac.uk/~charles/statlog
CUADRAS C.M., `Métodos de Análisis Multivariante, 1.edición EUNIBAR, 1981, 2.edición, Promociones y Publicaciones Universitarias, 1991.
ESCOFFIER B., PAGÈS J., `Analyses factorielles simples et multiples¿, Dunod. Versión en español `Análisis factoriales simples y múltiples, Servicio editorial de la UPV/EHU, 1995.
JAMBU, M., LEBEAUX, M.-O `Cluster Analysis and Data Analysis¿., North-Holland, 1983.
JAMBU, M., `Exploration informatique et statistique des données¿, Dunod, 1989.
BERTHOLD M., HAND, D.J., (eds), Intelligent Data Analysis: An Introduction, Springer Verlag, 1999.
CLEVELAND W., 'Visualizing Data', Summit, NJ: Hobart Press, 1993.
CLEVELAND W.,`The Elements of Graphing Data, revised¿, Hobart Press, 1994
WALLGREN A. et alt., 'Graphing Statistics & Data', Sage Publications, 1996.
JACOBY W.G., 'Statistical Graphics for Visualizing Multivariate Data', Sage Publications,