Del píxel a las resonancias visuales: La imagen con voz propia

Pilar Rosado Rodrigo, Eva Figueras Ferrer, Ferran Reverter Comes

Resumen


Esta investigación aborda el problema de la detección aspectos latentes en grandes colecciones de imágenes de obras de artista abstractas, atendiendo sólo a su contenido visual. Se ha programado un algoritmo de descripción de imágenes utilizado en visión artificial cuyo enfoque consiste en colocar una malla regular de puntos de interés en la imagen y seleccionar alrededor de cada uno de sus nodos una región de píxeles para la que se calcula un descriptor que tiene en cuenta los gradientes de grises encontrados. Los descriptores de toda la colección de imágenes se pueden agrupar en función de su similitud y cada grupo resultante pasará a determinar lo que llamamos palabras visuales. El método se denomina Bag-of-Words (bolsa de palabras). Teniendo en cuenta la frecuencia con que cada palabra visual  ocurre en cada imagen, aplicamos el modelo estadístico pLSA (Probabilistic Latent Semantic Analysis), que clasificará de forma totalmente automática las imágenes según su categoría formal. Esta herramienta resulta de utilidad tanto en el análisis de obras de arte como en la producción artística.


Palabras clave


VISIÓN ARTIFICIAL; MODELO BAG-OF-WORDS; CBIR (RECUPERACIÓN DE IMÁGENES POR CONTENIDO); PLSA (ANÁLISIS PROBABILÍSTICO DE ASPECTOS LATENTES); PALABRA VISUAL

Texto completo:

PDF

Referencias


Flusser, Vilém. 2009. Una filosofía de la fotografía. Traducción, Thomas Schilling. El Espíritu y la Letra 5. Madrid: Síntesis

Hofmann, Thomas. 2001. “Unsupervised learning by probabilistic latent semantic analysis”. Machine Learning 42

Kandinsky, Vasili Vasilievich (1912) 1987. La gramática de la creación. El futuro de la pintura. Ed. y notas de Philippe Sers. Barcelona: Paidós

Kandinsky, Vasili Vasilievich (1926) 1996. Punto y línea sobre el plano: Contribución al análisis de los elementos pictóricos. Traducción Roberto Echavarren. Barcelona: Paidós

Koffka, Kurt. (1935). 2014. Principles of Gestalt Psychology. Milano: Mimesis International

Köhler, Wolfgang. (1947) 1992. Gestalt psychology: an introduction to new concepts in modern psychology. New York: Liveright

Lazebnik, Svetlana, Cordelia Schmid & Jean Ponce. 2006. “Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories”. IEEE Computer Society Conference on Computer Vision and Pattern Recognition 2: 2169-78. Doi: doi.ieeecomputersociety.org/10.1109/CVPR.2006.68

Lowe, David G. 2000. “Towards a computational model for object recognition in IT cortex”. En Biologically motivated computer vision: First IEEE International Workshop, BMCV 2000 Seoul, Korea, May 15-17: Proceedings, Seong-Whan Lee Heinrich H. Bülthoff & Tomaso Poggio, eds., 20-31. Berlin: Springer

Lowe, David G. 2004. “Distinctive image features from scale invariant keypoints”. International Journal of Computer Vision 60(2): 91-110

Reverter Comes, Ferrán, Eva Figueras Ferré, Miquel Planas-Rosselló & Pilar Rosado-Rodrigo. 2013. Ideación y catalogación artística basada en métodos de visión artificial. Barcelona: Raima

Rosado-Rodrigo, Pilar, Ferrán Reverter Comes, Eva Figueras Ferré & Miquel Planas-Rosselló. 2014. “Semantic-based image analysis with the goal of assisting artistic creation”. Lecture Notes in Computer Science 8671: 526-33. Doi: 10.1007/978-3-319-11331-9

Rosado-Rodrigo, Pilar, Eva Figueras Ferré & Ferrán Reverter Comes. 2014. “Intersecciones entre visión artificial y mirada artística”. BRAC 2(1): 1-54. Doi:10.4471/brac.2014.01


Enlaces refback

  • No hay ningún enlace refback.




UPV/EHU Press