Mejorando la calidad de los datos de biodiversidad en América Latina: documentando las mejores prácticas en los flujos de trabajo y ciclos de vida de los datos

Casi todos los registros de ocurrencia en GBIF se pueden refinar o mejorar. En América Latina, tanto los profesionales de los datos como los encargados de la toma de decisiones constantemente mencionan la calidad de los datos como una prioridad para garantizar su inclusión en las estrategias y políticas nacionales de conservación.

Este proyecto, liderado por SiB Colombia (nodo de GBIF por Colombia), abordará esta necesidad al documentar las mejores prácticas para mejorar la calidad de los datos en cada etapa del flujo de trabajo de datos típico. Si bien el proyecto se centrará en brindar un conjunto de mejores prácticas adaptadas a las necesidades locales de América Latina, el documento resultante se basará y reunirá materiales existentes de toda la comunidad global.

Las actividades girarán en torno a un par de talleres virtuales, y el equipo del proyecto documentará los enfoques recomendados en tres etapas diferentes de los flujos de trabajo típicos de datos: digitalización, publicación y repatriación de datos.

  1. Datos no publicados: Una gran cantidad de información sobre biodiversidad en América Latina permanece sin digitalizar. Para mejorar la calidad general y la idoneidad para el uso, es fundamental tener en cuenta la calidad de los datos en las primeras etapas de los procesos de digitalización. El proyecto buscará producir protocolos claros y consistentes para la distribución entre los proveedores de datos.
  2. Datos publicados: Los datos ya publicados son de calidad variable. Necesitamos implementar procesos de calidad de datos unificados a nivel de nodos y proveedores, para identificar y corregir errores, complementar la información existente cuando está incompleta y volver a publicar los datos.
  3. Repatriación de datos: necesitamos datos de buena calidad y listos para la investigación para la toma de decisiones. Un porcentaje considerable de los datos de biodiversidad publicados sobre nuestros países provienen de instituciones extranjeras. Necesitamos un protocolo claro y unificado para guiar la reingestión, evaluación y mejora de la calidad de estos datos.

Si bien el producto principal, una guía titulada provisionalmente Mejores prácticas de calidad de datos para la digitalización, publicación y repatriación de datos de biodiversidad, aparecerá primero en español, el equipo del proyecto también entregará un resumen en inglés, con el documento completo disponible para traducción como el resto de Documentación digital de GBIF.

Fuentes y precedentes

  • Chapman AD (2005) Principles of Data Quality. Copenhagen: Global Biodiversity Information Facility. https://doi.org/10.15468/doc.jrgg-a190
  • Chapman AD, Belbin L, Zermoglio PF, Wieczorek J, Morris PJ, Nicholls M, Rees ER, Veiga AK, Thompson A, Saraiva AM, James SA, Gendreau C, Benson A, Schigel D (2020). Developing Standards for Improved Data Quality and for Selecting Fit for Use Biodiversity Data. Biodiversity Information Science and Standards 4: e50889. https://doi.org/10.3897/biss.4.50889
  • Comisión Nacional para el Conocimiento y Uso de la Biodiversidad, México (2017) CONABIO, 25 años de evolución. Ciudad de México: CONABIO. https://www.gob.mx/cms/uploads/attachment/file/262393/25_an_os_Conabio_web.pdf
  • CONABIO (2019) Datos primarios de ejemplares del Sistema Nacional sobre Biodiversidad (SNIB): características y reglas. Ciudad de México: CONABIO. http://www.snib.mx/ejemplares/docs/CONABIO-SNIB-ProtocoloCalidadI.pdf
  • Escobar D, Jojoa LM, Díaz SR, Rudas E, Albarracín RD, Ramírez C, Gómez JY, López CR, Saavedra J & Ortiz R (2016) Georreferenciación de localidades: Una guía de referencia para colecciones biológicas, versión 4.0. Bogotá, Colombia: Instituto de Investigación de Recursos Biológicos Alexander von Humboldt y Instituto de Ciencias Naturales, Universidad Nacional de Colombia. https://hdl.handle.net/20.500.11761/35180
  • Hill AW, Otegui J, Ariño AH & Guralnick RP (2010) GBIF Position Paper on Future Directions and Recommendations for Enhancing Fitness-for-Use Across the GBIF Network, version 1.0. Copenhagen: Global Biodiversity Information Facility. https://www.gbif.org/document/80623/
  • Escobar D, Beltrán N, Buitrago L, Plata C & Delgado E (2015) Calidad de Datos: Guía de herramientas para mejorar los datos primarios de biodiversidad, versión 1.0. Bogotá, Colombia: SiB Colombia. https://hdl.handle.net/20.500.11761/35351
  • Escobar D & Ortiz R (2018) Lineamientos para la georreferenciación de datos sobre biodiversidad. versión 1.0. Bogotá, Colombia: SiB Colombia. https://hdl.handle.net/20.500.11761/35331
  • Buitrago L, Plata C, Ortíz R, Beltrán N (2019) OpenRefine - Guía básica, Limpieza de datos sobre biodiversidad, versión 1.0. Bogotá, Colombia: SiB Colombia. https://hdl.handle.net/20.500.11761/35348
  • Ortíz R, Plata C & Buitrago L (2019) OpenRefine - Guía de validación y limpieza de datos sobre biodiversidad, versión 1.0. Bogotá D.C.: SiB Colombia. https://hdl.handle.net/20.500.11761/35350
  • Veiga AK, Saraiva AM, Chapman AD, Morris PJ, Gendreau C, Schigel D & Robertson TJ (2017) A conceptual framework for quality assessment and management of biodiversity data. PLoS ONE 12(6):e0178731. https://doi.org/10.1371/journal.pone.0178731

Financiación: €14.735.

Cofinanciación: €37.500.

Ejecución: 30 noviembre 2020 - 30 abril.

Programa: Programa de apoyo a la mejora de capacidades (CESP).

Identificador del proyecto: CESP2020-018.

Financiado por: GBIF.

Líder de proyecto: SiB Colombia.

Socios:

Detalles de contacto:
Dairo Escobar
Sistema de Información sobre Biodiversidad de Colombia - SiB Colombia
Instituto de Investigación de Recursos Biológicos Alexander von Humboldt
Calle 28A #15-09
111311 Bogotá, D.C.
Colombia

Resultados