Descripción
Este curso trata sobre el manejo, visualización y análisis de datos geoespaciales de biodiversidad mediante el lenguaje de programación Python. Se estudian los fundamentos de Python, sus módulos geoespaciales y su aplicación al procesamiento de datos de biodiversidad. Se demuestra como metodologías y técnicas de ciencia de datos pueden ser aplicadas al componente geoespacial de datos de biodiversidad.
Importante: Se abrirá un único grupo.
- Inicia el lunes 13 de enero de 2025 y se impartirá todos los lunes de 6:00 p.m. a 8:00 p.m. (GMT-6) durante 8 semanas.
- Modalidad: Virtual.
- Teórico/Práctico: Para completar el programa, es necesario tener una asistencia efectiva de más del 75% de las clases sincrónicas virtuales, y sus evaluaciones con un promedio mayor o igual a 70.
- Costo: Gratuito.
- Tener disponibilidad de al menos 16 horas durante todo el programa para asistir a ocho sesiones sincrónicas virtuales de clases. (2hrs / clase)
- Tener disponibilidad de al menos 24 horas durante todo el programa para realizar tareas cortas, los laboratorios prácticos del curso y un proyecto final. (3hrs / semana)
- Llenar el formulario para Participar en las actividades de la redbioma (anteriormente circulado, por favor llenarlo una sola vez).
Formulario de inscripción
Enlace: Inscripciones Procesamiento de datos geoespaciales
Objetivos
General
Aprender a desarrollar programas en el lenguaje de programación Python orientados al procesamiento de datos geoespaciales de biodiversidad.
Específicos
- Aplicar un enfoque de ciencia de datos en los procesos de importación, transformación, visualización, análisis y comunicación de datos geoespaciales de biodiversidad.
- Desarrollar soluciones reproducibles a problemas computacionales mediante Python.
- Integrar visualizaciones tabulares, gráficas y geoespaciales de datos de biodiversidad en documentos y aplicaciones interactivas desarrolladas en Python.
Metodología del curso
El curso se desarrolla mediante clases teórico-prácticas virtuales y sincrónicas. Los conceptos teóricos son explicados por el profesor durante las sesiones teóricas y también a través de lecturas previamente asignadas. Las sesiones prácticas se destinan a la realización de diferentes ejercicios de programación por parte de los estudiantes.
Los contenidos de las lecciones están disponibles en el sitio web del curso, en el que hay enlaces a la bibliografía y a otros recursos de aprendizaje como tutoriales y videos.
Importante:- Todas las sesiones sincrónicas serán grabadas y publicadas en el sitio web del proyecto.
- Los proyectos finales de investigación serán publicados en el sitio web del proyecto.
Contenidos del programa
- Introducción al curso
- Revisión del programa del curso.
- Ciencia de datos y reproducibilidad.
- El lenguaje de marcado Markdown.
- Cuadernos de notas Jupyter.
- El lenguaje de programación Python
- Tipos de datos básicos.
- Variables.
- Expresiones.
- Comentarios.
- Condicionales.
- El lenguaje de programación Python (continuación)
- Ciclos.
- Estructuras de datos.
- Listas.
- Tuplas.
- Conjuntos.
- Diccionarios.
- Introducción a los datos de biodiversidad
- El estándar de Darwin Core.
- La biblioteca Pygbif.
- Análisis y visualización de datos
- La biblioteca Pandas.
- Graficación estadística
- La biblioteca Matplotlib.
- La biblioteca Plotly.
- Introducción a los datos geoespaciales
- Modelos de datos.
- Sistemas de información geográfica.
- Datos vectoriales
- La biblioteca GeoPandas.
- Datos raster
- La biblioteca Rasterio.
- Visualización de datos geoespaciales de biodiversidad
- La biblioteca Leafmap.
Evaluación
Las personas estudiantes llevarán a cabo tareas y un proyecto final, los rubros de las evaluaciones serán los siguientes:
Rubro | Valor (%) |
---|---|
Asistencias | 30 |
Tareas | 30 |
Proyecto final | 40 |
Total | 100 |
Cronograma de clases
Clase | Semana |
---|---|
Introducción | 1 |
Lenguaje de programación Python | 2 |
Lenguaje de programación Python (continuación) | 3 |
Introducción a los datos de biodiversidad, Análisis y visualización de datos | 4 |
Graficación estadística | 5 |
Introducción a los datos geoespaciales, Datos vectoriales | 6 |
Datos raster | 7 |
Visualización de datos geoespaciales de biodiversidad | 8 |
Referencias
-
Downey, A. B. (2024). Think Python: How to think like a computer scientist (3rd ed.). Green Tea Press. Enlace externo
-
Geopandas contributors. (s.f.). geopandas: Geographic pandas extensions. Recuperado 1 de enero de 2022, de Enlace externo
-
GeoPandas contributors. (s.f.). GeoPandas: Geographic pandas extensions. Recuperado el 1 de enero de 2022, de Enlace externo
-
Kaggle. (s.f.-a). Learn Pandas. Recuperado 1 de agosto de 2024, de Enlace externo
-
Kaggle. (s.f.-b). Learn Data Visualization. Recuperado 1 de agosto de 2024, de Enlace externo
-
Kaggle. (s.f.-c). Learn Geospatial Analysis. Recuperado 1 de agosto de 2024, de Enlace externo
-
Markdown Tutorial. (s.f.). Markdown Tutorial. Recuperado el 19 de marzo de 2022, de Enlace externo
-
P, C. (s.f.). Plotly: An open-source, interactive data visualization library for Python. Recuperado 1 de agosto de 2024, de Enlace externo
-
Rey, S. J., Arribas-Bel, D., & Wolf, L. J. (2020). Geographic Data Science with Python. Enlace externo
-
Severance, C. R. (2016). Python for everybody: Exploring data in Python 3 (S. Blumenberg & E. Hauser, Eds.). CreateSpace Independent Publishing Platform. Enlace externo
-
The Pandas Development Team. (s.f.). Pandas: Powerful data structures for data analysis, time series, and statistics. Recuperado 1 de enero de 2022, de Enlace externo
Contactos
Persona facilitadora | Correo electrónico |
---|---|
Instructor: Manuel Vargas | mfvargas@gmail.com |
María Auxiliadora Mora | maria.mora@itcr.ac.cr |