Materia

Contenido de XSL

Exploración y análisis de datos

Datos generales de la materia

Modalidad
Presencial
Idioma
Castellano

Descripción y contextualización de la asignatura

Según avanza la tecnología para la captura y el almacenamiento de datos de todo tipo, la acumulación de datos se hace más intensa. Explorar este conjunto de datos, y analizarlo, para extraer las informaciones útiles es una tarea primordial en cualquier área de conocimiento en el que se aplique el método de recogida de datos, como pueden ser la búsqueda de conocimiento en bases de datos, los sistemas de ayuda a la decisión, el análisis lingüístico, la segmentación de imágenes, el análisis de señales, el reconocimiento de voces, la identificación de secuencias de ADN, etc.

El tipo de información de entrada que va a ser tratado mediante las técnicas que se presentan en la asignatura, se basa en ejemplos cuya representación es del tipo objeto-variable-valor, que es la más habitual. El análisis de las variables reflejadas en los ejemplos conduce a inducir estructuras con el fin de aplicarlas a nuevos ejemplos.

Dichas técnicas se engloban en lo que se denomina actualmente `data mining¿ (`minería de datos¿), y que de forma más explícita se refiere a la exploración y análisis de datos. Otras denominaciones que responden parcialmente al mismo conjunto de técnicas, son los de análisis multivariante, descubrimiento de conocimiento (`knowledge discovery¿), aprendizaje automático (`machine learning¿), o reconocimiento de patrones (`pattern recognition¿).

Los métodos de análisis de datos se fundamentan en métodos estadísticos, y sus técnicas en el desarrollo progresivo de los instrumentos de computación. Estamos así ante una asignatura que está en la bisagra de la computación y la estadística. Las técnicas se conciben dependiendo de la herramienta de cálculo disponible.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
IRIGOYEN GARBIZU, ITZIARUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeCiencia de la Computación e Inteligencia Artificialitziar.irigoien@ehu.eus
MORI CARRASCAL, USUEUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado Adjunto (Ayudante Doctor/A)DoctoraBilingüeCiencia de la Computación e Inteligencia Artificialusue.mori@ehu.eus

Competencias

DenominaciónPeso
Conocer los principios teóricos y los fundamentos avanzados de la computación estadística, numérica y gráfica, de los sistemas basados en la inteligencia artificial, y de la representación de la información.33.0 %
Saber aplicar los fundamentos y avances en computación estadística, numérica y gráfica, en sistemas basados en la inteligencia artificial, y en la representación de la información, para desarrollar sistemas, servicios y aplicaciones informáticas innovadoras, definiendo, evaluando y seleccionando plataformas hardware y software adecuadas.33.0 %
Ser capaz de crear nuevos algoritmos y modelos de computación estadística, numérica y gráfica, nuevos paradigmas de inteligencia artificial y nuevas técnicas de representación de la información, analizando su complejidad computacional, demostrando su validez y obteniendo desarrollos tecnológicos.33.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral304575
Seminario101525
P. Ordenador203050

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Actividades propuestas por el equipo docente a través de la plataforma virtual0.00 %
Clases expositivas20.0100 %
Elaboración de informes y exposiciones30.030 %
Estudio sistematizado40.00 %
Horas de contacto virtual a través de la plataforma (participación en foros, consulta de dudas, etc)0.0100 %
Interacción con el docente en entornos virtuales0.030 %
Lectura y análisis prácticos40.050 %
Talleres de aplicación20.0100 %
Videoconferencias0.0100 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Asistencia y Participación15.0 % 25.0 %
Exposiciones30.0 % 40.0 %
Otros0.0 % 10.0 %
Participación en los foros15.0 % 25.0 %
Pruebas de evaluación a distancia75.0 % 85.0 %
Trabajos Prácticos30.0 % 40.0 %

Temario

Introducción general a la problemática y nociones básicas

Visualización de una variable y de las relaciones entre variables

Métodos de clasificación no supervisada

Métodos de clasificación supervisada

Métodos de reducción de la dimensionalidad (factoriales)

Combinación de métodos

Bibliografía

Bibliografía básica

HAND, D., MANNILA, H., SMYTH, P., `Principles of Data Mining¿, MIT Press, 2001.

LEBART L., PIRON M., MORINEAU A., `Statistique exploratoire multidimensionnelle¿, Dunod, 4eme édition, 2006.

HASTIE T., TIBSHIRANI R., FRIEDMAN J., `The Elements of Statistical Learning: Data Mining, Inference, and Prediction¿, Springer Verlag, 2001.

MYATT G.J., `Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data Mining¿, John Wiley, 2006.

Bibliografía de profundización

ANDERBERG M.R., `Cluster analysis for applications¿, Academic Press, New York, 1973. HARTIGAN J., `Clustering Algorithms¿, Wiley, 1975, BREIMAN L., FRIEDMAN J., OLSHEN R., STONE C., `Classification and Regression Trees¿, Wadsworth and Brooks, Monterrey CA, 1984. QUINLAN J.R, `C4.5: Programs for Machine Learning¿, Morgan Kaufmann, 1992 FAYYAD U., PIATETSKY-SHAPIRO G., SMYTH P., UTHURUSAMY R., (eds.), `Advances in Knowledge Discovery and Data Mining¿, AAAI/MIT Press, 1996. D. MICHIE, D.J. SPIEGELHALTER, C.C. TAYLOR, (eds), `Machine Learning, Neural and Statistical Classification¿ http://www.amsta.leeds.ac.uk/~charles/statlog CUADRAS

C.M., `Métodos de Análisis Multivariante, 1.edición EUNIBAR, 1981, 2.edición, Promociones y Publicaciones Universitarias, 1991.

ESCOFFIER B., PAGÈS J., `Analyses factorielles simples et multiples¿, Dunod. Versión en español `Análisis factoriales simples y múltiples, Servicio editorial de la UPV/EHU, 1995.

JAMBU, M., LEBEAUX, M.-O `Cluster Analysis and Data Analysis¿., North-Holland, 1983.

JAMBU, M., `Exploration informatique et statistique des données¿, Dunod, 1989.

BERTHOLD M., HAND, D.J., (eds), Intelligent Data Analysis: An Introduction, Springer Verlag, 1999.

CLEVELAND W., 'Visualizing Data', Summit, NJ: Hobart Press, 1993.

CLEVELAND W.,`The Elements of Graphing Data, revised¿, Hobart Press, 1994

WALLGREN A. et alt., 'Graphing Statistics & Data', Sage Publications, 1996.

JACOBY W.G., 'Statistical Graphics for Visualizing Multivariate Data', Sage Publications,

Enlaces

www.kdnuggets.com

Contenido de XSL

Sugerencias y solicitudes