Procesamiento de datos geoespaciales de biodiversidad mediante el lenguaje de programación Python

Descripción

Este curso trata sobre el manejo, visualización y análisis de datos geoespaciales de biodiversidad mediante el lenguaje de programación Python. Se estudian los fundamentos de Python, sus módulos geoespaciales y su aplicación al procesamiento de datos de biodiversidad. Se demuestra como metodologías y técnicas de ciencia de datos pueden ser aplicadas al componente geoespacial de datos de biodiversidad.


Horario y fecha de inicio
Importante: Se abrirá un único grupo.
  • Inicia el lunes 13 de enero de 2025 y se impartirá todos los lunes de 6:00 p.m. a 8:00 p.m. (GMT-6) durante 8 semanas.


Tipo de curso
  • Modalidad: Virtual.
  • Teórico/Práctico: Para completar el programa, es necesario tener una asistencia efectiva de más del 75% de las clases sincrónicas virtuales, y sus evaluaciones con un promedio mayor o igual a 70.
  • Costo: Gratuito.


Requisitos
  • Tener disponibilidad de al menos 16 horas durante todo el programa para asistir a ocho sesiones sincrónicas virtuales de clases. (2hrs / clase)
  • Tener disponibilidad de al menos 24 horas durante todo el programa para realizar tareas cortas, los laboratorios prácticos del curso y un proyecto final. (3hrs / semana)
  • Llenar el formulario para Participar en las actividades de la redbioma (anteriormente circulado, por favor llenarlo una sola vez).


Formulario de inscripción

Enlace: Inscripciones Procesamiento de datos geoespaciales


Objetivos

General

Aprender a desarrollar programas en el lenguaje de programación Python orientados al procesamiento de datos geoespaciales de biodiversidad.


Específicos

  • Aplicar un enfoque de ciencia de datos en los procesos de importación, transformación, visualización, análisis y comunicación de datos geoespaciales de biodiversidad.
  • Desarrollar soluciones reproducibles a problemas computacionales mediante Python.
  • Integrar visualizaciones tabulares, gráficas y geoespaciales de datos de biodiversidad en documentos y aplicaciones interactivas desarrolladas en Python.


Metodología del curso

El curso se desarrolla mediante clases teórico-prácticas virtuales y sincrónicas. Los conceptos teóricos son explicados por el profesor durante las sesiones teóricas y también a través de lecturas previamente asignadas. Las sesiones prácticas se destinan a la realización de diferentes ejercicios de programación por parte de los estudiantes.

Los contenidos de las lecciones están disponibles en el sitio web del curso, en el que hay enlaces a la bibliografía y a otros recursos de aprendizaje como tutoriales y videos.

Importante:
  • Todas las sesiones sincrónicas serán grabadas y publicadas en el sitio web del proyecto.
  • Los proyectos finales de investigación serán publicados en el sitio web del proyecto.


Contenidos del programa

  1. Introducción al curso
    1. Revisión del programa del curso.
    2. Ciencia de datos y reproducibilidad.
    3. El lenguaje de marcado Markdown.
    4. Cuadernos de notas Jupyter.
  2. El lenguaje de programación Python
    1. Tipos de datos básicos.
    2. Variables.
    3. Expresiones.
    4. Comentarios.
    5. Condicionales.
  3. El lenguaje de programación Python (continuación)
    1. Ciclos.
    2. Estructuras de datos.
      1. Listas.
      2. Tuplas.
      3. Conjuntos.
      4. Diccionarios.
  4. Introducción a los datos de biodiversidad
    1. El estándar de Darwin Core.
    2. La biblioteca Pygbif.
  5. Análisis y visualización de datos
    1. La biblioteca Pandas.
  6. Graficación estadística
    1. La biblioteca Matplotlib.
    2. La biblioteca Plotly.
  7. Introducción a los datos geoespaciales
    1. Modelos de datos.
    2. Sistemas de información geográfica.
  8. Datos vectoriales
    1. La biblioteca GeoPandas.
  9. Datos raster
    1. La biblioteca Rasterio.
  10. Visualización de datos geoespaciales de biodiversidad
    1. La biblioteca Leafmap.


Evaluación

Las personas estudiantes llevarán a cabo tareas y un proyecto final, los rubros de las evaluaciones serán los siguientes:


Rubro Valor (%)
Asistencias 30
Tareas 30
Proyecto final 40
Total 100


Cronograma de clases

Clase Semana
Introducción 1
Lenguaje de programación Python 2
Lenguaje de programación Python (continuación) 3
Introducción a los datos de biodiversidad, Análisis y visualización de datos 4
Graficación estadística 5
Introducción a los datos geoespaciales, Datos vectoriales 6
Datos raster 7
Visualización de datos geoespaciales de biodiversidad 8


Referencias

  1. Downey, A. B. (2024). Think Python: How to think like a computer scientist (3rd ed.). Green Tea Press. Enlace externo

  2. Geopandas contributors. (s.f.). geopandas: Geographic pandas extensions. Recuperado 1 de enero de 2022, de Enlace externo

  3. GeoPandas contributors. (s.f.). GeoPandas: Geographic pandas extensions. Recuperado el 1 de enero de 2022, de Enlace externo

  4. Kaggle. (s.f.-a). Learn Pandas. Recuperado 1 de agosto de 2024, de Enlace externo

  5. Kaggle. (s.f.-b). Learn Data Visualization. Recuperado 1 de agosto de 2024, de Enlace externo

  6. Kaggle. (s.f.-c). Learn Geospatial Analysis. Recuperado 1 de agosto de 2024, de Enlace externo

  7. Markdown Tutorial. (s.f.). Markdown Tutorial. Recuperado el 19 de marzo de 2022, de Enlace externo

  8. P, C. (s.f.). Plotly: An open-source, interactive data visualization library for Python. Recuperado 1 de agosto de 2024, de Enlace externo

  9. Rey, S. J., Arribas-Bel, D., & Wolf, L. J. (2020). Geographic Data Science with Python. Enlace externo

  10. Severance, C. R. (2016). Python for everybody: Exploring data in Python 3 (S. Blumenberg & E. Hauser, Eds.). CreateSpace Independent Publishing Platform. Enlace externo

  11. The Pandas Development Team. (s.f.). Pandas: Powerful data structures for data analysis, time series, and statistics. Recuperado 1 de enero de 2022, de Enlace externo


Contactos

Persona facilitadora Correo electrónico
Instructor: Manuel Vargas mfvargas@gmail.com
María Auxiliadora Mora maria.mora@itcr.ac.cr