DOCTORADO-BIODIVERSIDAD-ACTIVIDADES-2024

Doctoral Programme in Biodiversity, Ecosystem Functioning and Management

Ciencia de datos en R

Programa de doctorado que propone la actividad

Biodiversidad, Funcionamiento y Gestión de Ecosistemas

Persona de contacto

Arantza Aldezabal Roteta

Breve descripción de la actividad

Resumen

En este curso, exploraremos tanto los fundamentos teóricos como las aplicaciones prácticas de la ciencia de datos en R. Abordaremos desde tareas comunes que nos enfrentamos en nuestro día a día, como la limpieza y transformación de datos, hasta nociones más avanzadas de visualización y programación. Además, aprenderemos a utilizar herramientas para generar documentos reproducibles y colaborativos. Durante el curso, combinaremos la teoría con la práctica, adaptando las lecciones a los problemas específicos de cada asistente, los cuales irán evolucionando día a día.

Objetivo del curso

El objetivo principal es garantizar que tanto quienes tienen conocimientos básicos en ciencia de datos como quienes tienen un nivel más avanzado puedan beneficiarse y llevar consigo nuevos aprendizajes al finalizar el curso.

Requisitos

Estar familiarizado con el lenguaje de programación R y el entorno de RStudio.

Equipamiento requerido

Los asistentes deben llevar su propio portátil y tener instalado la última versión de R (https://cloud.r-project.org), RStudio (https://posit.co/download/rstudio-desktop/) y la colección de paquetes de {tidyverse} (https://www.tidyverse.org/). Durante el curso os indicaremos cómo instalar Git (https://happygitwithr.com/install-git.html) y generar una cuenta en GitHub (https://github.com/).

Estructura del curso (programa)

Sesión 1: Organizando datos: el día a día

  • Importar
  • Explorar
  • Limpiar
  • Transformar
  • Manejar

Sesión 2: Visualización: contando historias

  • Fundamentos de visualización
  • Bases: gráficos por capas
  • Visualización avanzada
  • Introducción a la creación de mapas

Sesión 3: Programación: aprendiendo a programar con funciones

  • Funciones
  • Estilo de código
  • Iteraciones
  • Programación funcional

Sesión 4: Comunicación: generando documentos reproducibles

  • Introducción a R Markdown
  • Introducción a Quarto
  • R Markdown vs Quarto
  • Trabajos reproducibles

Sesión 5: Colaboración: trabajando en equipo

  • Introducción a Git
  • Introducción a GitHub
  • Flujo de trabajo en Git y GitHub
  • Trabajos colaborativos

Profesorado

Dr. Julen Astigarraga Urcelay
Universidad de Alcalá

Julen Astigarraga Urcelay es doctor por la Universidad de Alcalá (Madrid). Actualmente es investigador postdoctoral en la Universidad de Alcalá en el proyecto europeo de investigación “Climate mitigation and bioeconomy pathways for sustainable forestry”.

Su investigación actual se centra en cuantificar los patrones espaciotemporales de la dinámica forestal y los factores que la impulsan, con especial atención en los impactos de los cambios en el clima y el uso del suelo. Para ello, integra datos de inventarios forestales, dendrocronología, imágenes satelitales y datos climáticos, abarcando desde escalas locales hasta hemisféricas y desde períodos temporales de una década hasta un siglo.

Su investigación tiene como objetivo obtener una comprensión integral de cómo los bosques podrían verse afectados por los crecientes impactos del cambio climático y las actividades humanas, proporcionando en última instancia información sobre posibles trayectorias futuras. Es uno de los coordinadores del grupo de Ecoinformática de la Asociación Ecológica Española de Ecología Terrestre y uno de los editores de las notas ecoinformáticas de la revista Ecosistemas.

Dra. Verónica Cruz Alonso
Universidad Complutense de Madrid

Verónica Cruz es doctora por la Universidad de Alcalá, tesis doctoral sobre restauración forestal en campos agrícolas abandonados. Investigadora postdoctoral en diferentes instituciones como el CREAF (Cataluña) y la Universidad de Harvard (Estados Unidos). Actualmente trabaja en el Departamento de Biodiversidad, Ecología y Evolución de la Universidad Complutense de Madrid.

El principal foco de su investigación es entender los factores que condicionan la capacidad natural de regeneración de los bosques y la reestructuración de la comunidad de especies en sitios afectados por actividades humanas. Co-coordinadora del grupo de trabajo de Ecoinformática de la Asociación Española de Ecología Terrestre y editora de las notas ecoinformáticas de la revista Ecosistemas. Además, ha impartido diferentes cursos y talleres sobre ciencia reproducible, programación y análisis estadístico.

Idioma del curso

Castellano

Calendario

Del 23 al 27 de septiembre de 2024: 4 horas por día (total 20 horas) Horario: de 10:00h a 14:00h.

Lugar de impartición

UPV/EHU- Facultad de Ciencia y Tecnología