Mapeo de la cobertura vegetal en la subcuenca Quillcay (Ancash, Perú) con el clasificador de Árbol de decisiones

Frank Santiago Bazan1, Helder Mallqui Meza2 y Raquel Rios Recra3

1Universidad Nacional Santiago Antúnez de Mayolo. Huaraz, Perú.
2Instituto Nacional de Investigación en Glaciares y Ecosistemas de Montaña. Huaraz, Perú
3Universidad Nacional Agraria La Molina. Lima, Perú

©Los autores. Este artículo es publicado por la Revista Aporte Santiaguino de la Universidad Nacional SantiagoAntúnez de Mayolo. Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución 4.0 Internacional. que permite: Compartir — copiar y redistribuir el material en cualquier medio o formato, Adaptar — remezclar, transformar y construir a partir del materialpara cualquier propósito, incluso comercialmente.

Resumen

La caracterización y delimitación de la cobertura vegetal existente en una determinada área geográfica es de vital importancia para una adecuada gestión de los recursos naturales.Ental sentido, esta investigación propone una metodología para realizar la delimitación de los tipos de cobertura vegetal de la subcuenca Quillcay. El área de estudio está localizada en los distritos de Huaraz e Independencia, provincia de Huaraz, Ancash; en la ladera occidental media de la Cordillera Blanca y Cuenca del Santa. La delimitación de la cobertura vegetal inició con la identificación de los tipos de cobertura vegetal dominantes (pajonal andino, bosque, bofedal y matorral arbustivo); luego, se definieron las características geográficas (pendiente y altitud) para cada tipo de cobertura vegetal. Posteriormente, se generaron capas con el clasificador Spectral Angle Mapper (SAM) y el cálculo del Normalized Difference Moisture Index (NDMI). Finalmente, a través del clasificador de árbol de decisiones se pudo integrar todas las capas determinadas anteriormente, y, de esta manera, se obtuvo la clasificación supervisada con el uso de información satelital Landsat 8 del año 2018 y DEM Alos Palsar. Los resultados indican que la aplicación del árbol de decisiones muestra una exactitud de la clasificación casi perfecta con un estadístico Kappa (K) de 0; 90. Consideramos que la metodología propuesta (árbol de decisiones) es ideal para delimitar la cobertura vegetal a escala subregional.

Palabras claves: Teledetección; Cobertura vegetal; Árbol de decisiones; Subcuenca Quillcay.

Introducción

El Perú es uno de los países con mayor diversidad de ecosistemas del mundo, los cuales se caracterizan por su gran complejidad vegetal, climática, geomorfológica y edáfica. La flora y vegetación se encuentran representadas por variedad de formas de vida vegetal o formas de crecimiento, distribuidas en paisajes que van desde las llanuras desérticas y semidesérticas, así como las llanuras aluviales con bosques lluviosos, hasta los paisajes colinosos y montañosos (MINAM, 2015 ). En ese sentido, la cobertura vegetal o también llamada la cobertura del suelo es entendida de forma diferente según las disciplinas científicas. Los ecólogos definen la cobertura del suelo según la presencia y abundancia de especies vegetales, mientras que para los edafólogos es un indicador de la composición y los tipos de suelos. Es muy habitual la utilización conjunta de los términos uso y cobertura, ya que, en función del objetivo final de la cartografía, se definen leyendas donde coexisten clases que corresponden a usos con otras que corresponden a coberturas (Borràs et al., 2017 ) .

Actualmente existen diferentes herramientas usadas para el estudio de la cobertura vegetal, tal es así que pueden aplicarse al análisis y la presentación de los datos de los recursos naturales, pero las técnicas del sistema de información geográfica (SIG) y de la teledetección se reconocen como herramientas poderosas y se utilizan ampliamente para la investigación de la dinámica espacio-temporal de la cobertura del suelo (Keshtkar y Winfried , 2016 ). Los procedimientos metodológicos para llevar a cabo estas tareas requieren un alto grado de intervención humana, ya que están basados casi íntegramente en la fotointerpretación de imágenes, o su comparación con otras imágenes u otra base de datos. Sin embargo, las recientes mejoras en la calidad de los sensores, tanto aerotransportados como espaciales, han supuesto un incremento significativo en la disponibilidad de imágenes de alta resolución (Borràs et al., 2017). Además, la libre disponibilidad en repositorios web de imágenes de satélite multiespectrales procedentes de misiones de observación de la tierra, podemos clasificar eficazmente los tipos de terreno y, por tanto, contribuir a los estudios y al mejor análisis del entorno terrestre (Mora et al., 2017).

El término teledetección se entiende como una técnica para identificar, clasificar y determinar las propiedades de un objeto mediante el análisis de datos adquiridos a distancia, sin contacto físico con el propio objeto, ofreciéndonos la capacidad única de vigilancia del medio ambiente que cubre extensas zonas geográficas, a la vez que capta información insustituible sobre la tierra, la atmósfera y los océanos. La cartografía de la cubierta vegetal es un proceso complicado y constituye un problema típico relacionado con la teledetección, debido a que influyen numerosos factores en la calidad del producto final. Por ello, se tiene que elegir entre una plétora de opciones que incluyen el tipo de imagen, el algoritmo de clasificación, los datos de entrenamiento/ validación, las características de entrada, las técnicas de pre y postprocesamiento, los datos auxiliares y las clases objetivo (Mora et al., 2017;Khatami et al., 2016 ).

La clasificación puede realizarse de forma supervisada (teniendo un conjunto de entrenamiento preclasificado) o de forma no supervisada (donde no se proporciona información adicional sobre el contenido de la imagen), siendo los clasificadores más tradicionales: distancia mínima, máxima verosimilitud, paralelepípedo,Mahalanobis y de función discriminante lineal (Shih et al., 2019 ;Berhane et al., 2018 ). Pero el avance en las técnicas de reconocimiento de patrones a través de la inteligencia artificial y el aprendizaje automático, que ofrecen productos más precisos y fiables, ha contribuido significativamente al desarrollo de clasificadores avanzados no paramétricos, como la máquina de vectores de apoyo (SVM), la red neuronal artificial (RNA) y el árbol de decisión (Huang et al. , 2002 ).

En su forma más simple, los clasificadores de árbol de decisiones (DT), llamada así por su estructura de árbol invertida, representan mediante un gráfico con estructura arbórea que comienza con una raíz, nodos internos y nodos terminales, que también se denominan hojas. Los nodos internos representan un valor de la condición del atributo y los nodos terminales u hojas contienen una única etiqueta, que corresponda la cubierta del suelo (Borràs et al., 2017; Shih et al., 2019). En este algoritmo, se requiere una información adecuada de las diferentes características junto con sus parámetros físicos, ya que la flexibilidad en el diseño permite seleccionar las variables de forma adecuada para poder reducir la dimensionalidad de los datos para analizar las imágenes satelitales. Este algoritmo es fácil de entender, analizar y es robusto por naturaleza (Ramana, 2019 ).

En este contexto, el objetivo del presente trabajo es delimitar la cobertura vegetal de la Subcuenca Quillcay, a través de la aplicación del clasificador de Árbol de decisiones, incluyendo características espectrales y topográficas.

Materiales y Métodos

LLa investigación es de tipo descriptivo, debido a que busca contribuir al conocimiento de la teledetección y a las técnicas de mapeo de la cobertura vegetal. El diseño de investigación fue no experimental.

La subcuenca Quillcay se encuentra políticamente en la provincia de Huaraz, distritos de Huaraz e Independencia. Geográficamente, entre las coordenadas UTM (WGS84 Zona L-18 Sur): m Este 221496;m Norte 8946764 y m Este 247495; m Norte 8955757; a una altitud comprendida entre los 3029 y 6219 m s.n.m; conformada por tres quebradas: Cojup, Quillcayhuanca y Shallap. Hidrográficamente, se localiza en la cuenca del río Santa, perteneciente a la vertiente del Pacífico, drena sus aguas en la margen derecha del río Santa.

Figura 1.Mapa de ubicación subcuenca Quillcay, Ancash.

La delimitación de los tipos de cobertura vegetal existentes en la subcuenca se realizó a través de las siguientes etapas:

  1. Revisión bibliográfica. Para identificar los tipos de cobertura vegetal existentes en la subcuenca para su posterior delimitación. Para ello, se tomaron en cuenta elMapa de cobertura vegetal del Perú y dos salidas a campo.
  2. Obtención de la imagen satelital. Esta fue descargada del USGS -NASA, y sus características se describen a continuación:
  3. Tabla 1. Información relevante de la imagen satelital Landsat
    Año Sensor Satélite N° de Bandas Fecha Path / Row Resolución (m)
    2018 OLI Landsat 8 11 21 - junio 008/067 30
  4. Procesamiento de las imágenes. Consistió en realizar la corrección radiométrica, debido a que fue necesario eliminar las distorsiones provocadas por la atmosfera, y topográfica, para homogenizar los valores de reflectancia entre las zonas más y menos iluminadas. La corrección radiométrica se realizó a nivel de la atmósfera (TOA) para lo cual se empleó la formula siguiente (USGS, 2019 ):
  5. La fórmula empleada para la corrección topográfica está dada por Minnaert (1941):

  6. Definición de variables geográficas. Se incluyeron dos, las cuales se detallan a continuación: Altitud, debido a que el desarrollo de determinada especie vegetal está limitado por su altitud, se definieron rangos de altitudes donde se desarrollan las especies seleccionadas, tomando como referencia el mapa de cobertura vegetal del Perú y las recomendaciones de expertos en el tema.
  7. Tabla 2. Rangos de altitud por tipo de cobertura vegetal
    Cobertura vegetal Altitud (msnm)
    Mínima Máxima
    Bofedal 3700 4300
    Matorral arbustivo 3900 4700
    Bosque 3855 4800
    Pajonal andino 3200 5600
    Fuente: Modificado de (MINAM, 2015 )

    Pendiente, debido a que las características de las pendientes tienen una influencia en los tipos de coberturas vegetales que se asientan, ya que el declive facilita la erosión y las pendientes suaves facilitan la acumulación de agua.

    Tabla 3. Rangos de pendiente por tipo de cobertura vegetal
    Cobertura vegetal Pendiente ( %)
    Mínima Máxima
    Bofedal 1 8
    Matorral arbustivo 8;5 35
    Bosque 35 60
    Pajonal andino 8;5 42
  8. Índice de diferencia normalizada de humedad (NDMI). Este indicador resalta la presencia o saturación de humedad que posee la superficie (Adauto y Willems, 2015). Para su cálculo se aplicó la siguiente fórmula:
  9. Obtención de firmas espectrales y Clasificación SAM (Spectral AngleMapper). Para realizar la clasificación SAM se tomaron puntos en campo de las coberturas vegetales, a los que se les extrajo las respuestas espectrales de las imágenes satelitales.
  10. Delimitación de coberturas vegetalesmediante el Árbol de decisiones. Se realizómediante la integración de las capas generadas en las etapas anteriores, lo que nos permitió realizar la clasificación supervisada con el uso de información satelital Landsat 8 y el producto DEM - Alos Palsar.
  11. Validación de resultados. La verificación de los resultados se realizó a través del desarrollo de una matriz de confusión, siguiendo la metodología establecida por el (MINAM, 2014 ). Además, se calculó el estadístico Kappa, que nos indicó precisión de la clasificación.

Resultados

A continuación, se muestran los principales resultados de las etapas previas y la aplicación del clasificador de árbol de decisiones para el mapeo de la cobertura vegetal predominante de la subcuenca Quillcay. También se muestra la tabla resumen de la matriz de confusión y el estadístico Kappa. Estos resultados son parte de la investigación de tesis «Evaluación de la influencia de la cobertura vegetal en el rendimiento hídrico de la unidad hidrográfica Quillcay, a través del modelo hidrológico DISAPRO I, Huaraz, Ancash, años 2000 y 2018».

En la subcuenca Quillcay, se identificaron cuatro tipos de cobertura vegetal predominante: bofedal, matorral, pajonal y bosque. Es importante mencionar que en el proceso de identificación de las coberturas vegetales se tuvieron en cuenta las características espectrales y espaciales de la imagen satelital Landsat 8. La aplicación de las técnicas de corrección radiométrica y topográ- fica a la imagen satelital, permitieron obtener una imagen satelital más homogénea, que fue el insumo principal para la obtención de las capas (mascaras) para el árbol de decisiones.

El análisis de las variables geográficas nos permitió establecer los rangos tanto altitudinales y de pendiente según el tipo coberturas vegetales. De acuerdo con la revisión bibliográfica y consulta a expertos, se determinó que los cuatro tipos de cobertura vegetal identificados se desarrollan en altitudes desde 3200 hasta 5600 m s.n.m. En cuanto a la pendiente, se identificó que la mayor parte se establecen en pendientes moderadamente empinadas a empinadas, con un porcentaje de superior a 8; 5 %. Se generó una capa por cada variable geográfica.

La discriminación de los bofedales fue un reto, porque se desarrollan en pendiente planas donde hay mayor variabilidad de desarrollo de diferentes tipos de cobertura vegetal y una clasificación supervisada tradicional no genera buenos resultados. Por lo tanto, fue necesaria la aplicación del NDMI, que nos generó una capa con las zonas con alta presencia de humedad, que para nuestra área de estudio serían bofedales. Con ello, logramos tener una adecuada discriminación de los bofedales.

Una capa muy importante, que sirvió como insumo para el árbol de decisiones fue la clasificación SAM, pero esta técnica implicó contar con respuestas espectrales de las cuatro coberturas vegetales identificadas.Para ello, se tomaron puntos en campo, los quecumplieron con el criterio de representatividad y predominancia. Del análisis de las respuestas espectrales se evidenció que existen claras diferencias de comportamiento en el espectro electromagnético (figura 1). Siendo el bofedal y bosque los tipos de cobertura vegetal con grados de reffectividad altos y bajos, respectivamente.

Figura 2. Firmas espectrales de los tipos de cobertura vegetal

Árbol de decisiones

Fue creado con 14 nodos de decisiones binarios, que incluyeron características geográficas y espectrales de la vegetación representativa, obteniéndose de esta manera una adecuada clasificación supervisada y discriminación de los pixeles de los cuatro tipos de cobertura vegetal y otros tipos de cobertura (áreas con escasa o sin vegetación y glaciar-agua) del área de estudio.

El resultado de la clasificación supervisada con insumos Landsat 8 del año 2018 y el producto DEM Alos Palsar, mediante el árbol de decisiones, se muestra a continuación:

Matriz de confusión

Muestra la evaluación de la exactitud de la clasificación correspondiente al año 2018, en el cual se obtuvo una precisión general de la clasificación del 90 % y un coeficiente Kappa de 0; 8998, que según los rangos de valoración de la fuerza de concordancia propuesto por Landis y Koch (1977), la clasificación digital es” Casi Perfecta".

Figura 3. Clasificador de Árbol de decisiones

Figura 4. Tipos de cobertura vegetal clasificados con el árbol de decisiones

Tabla 4. Evaluación de la precisión de la clasificación
Cobertura vegetal Verdadero
Bofedal Pajonal andino Matorral arbustivo Bosque Total Precisión del usuario Error de omisión
Bofedal 9 0 0 0 9 100 % 0 %
Pajonal andino 2 8 0 1 11 73 % 27 %
Matorral arbustivo 0 0 9 0 9 100 % 0 %
Bosque 0 0 1 10 11 91 % 9 %
Total 11 8 10 11 40
Precisión del productor 82 % 100 % 90 % 91 %
Error de omisión 18 % 0 % 10 % 9 %
Precisión general = 90 % Kappa (K) = 0; 8998

Por último, las áreas de los tipos de cobertura vegetal de la predominantes en la subcuenca Quillcay se muestran en la tabla 5.

Tabla 5. Área de la cobertura vegetal, subcuenca Quillcay
Cobertura vegetal Área (Ha)
Bosque 409; 32
Bofedal 190; 71
Matorral arbustivo 2295; 00
Pajonal 4405; 86

Discusión

Los tipos de cobertura vegetal evaluados en el presente estudio fueron:Matorral arbustivo, Pajonal, Bosque y Bofedal, debido a que son los más representativos en el ámbito de la subcuenca, lo cual está alineado al mapa de cobertura vegetal establecido por el MINAM (2015) y a las clases establecidas en el estudio de Ramos y Ramirez (2014). En cuanto a la imagen satelital, se empleó una Landsat 8 debido a que nuestra escala de trabajo fue regional, también porque es ampliamente utilizada para estudios regionales de la cobertura del suelo (Colditz , 2015).

La clasificación supervisada de los tipos de cobertura vegetal se realizó mediante la aplicación de un Árbol de decisiones, con el que se obtuvo una adecuada discriminación de las clases y separabilidad de píxeles (Yang et al., 2017 ), ya que es uno de los métodos más eficaces para obtener información sobre el uso y la cobertura del suelo a partir de imágenes satelitales (Shih et al., 2019 ;Adauto y Bram, 2015 ). Además, Berhane et al. (2018) indica que el árbol de decisión se utiliza para modelar la vegetación porque nos permite incluir variables independientes como métricas de la vegetación, la pendiente, el aspecto, la elevación y el relieve.

Los resultados de la evaluación de la exactitud de la clasificación supervisada mediante la matriz de confusión y el cálculo del estadístico Kappa son muy positivos, alta puntuación en ambas medidas, teniendo en cuenta la complejidad de la zona de estudio y el número de tipos de vegetación (Shukla et al., 2018 ). La alta exactitud también está relacionada al método de clasificación y a la minuciosa toma de las muestras de entrenamiento y las muestras de prueba para cada clase, afirmaciones que son confirmadas por Colditz (2015). Por otra parte, a la fecha en el Perú se viene aplicando diferentes métodos de clasificación digital de imágenes satelitales, pudiendo ser la metodología empleada en el presente estudio una alternativa a aplicar en zonas con similares características.

Finalmente, el área de la cobertura vegetal predominante en la subcuenca Quillcay para el año 2018 fue 7300; 89 Ha, que difiere de lo mencionado por Ramos y Ramirez (2014) quienes indican que en el año 2011, en la subcuenca Quillcay el área que cubría la vegetación fue de 4450; 70 ha. Esta divergencia en las áreas de la vegetación se podría dar debido a que en su estudio utilizan el método de clasificación supervisada de imágenes satelitales por máxima probabilidad, sin considerar las características espectrales y geográficas de la vegetación.

Conclusiones

En la subcuenca Quillcay se identificaron 4 tipos de cobertura vegetal predominantes: Pajonal, Bosque, Matorral Arbustivo y Bofedal; las que fueron delimitadas digitalmente a través de la aplicación de un árbol de decisiones, que permitió considerar las características geográficas y espectrales de los tipos de cobertura vegetal. Se obtuvieron buenos resultados, que fueron confirmados con la matriz de confusión y estadístico Kappa. La cobertura vegetal determinada para el año 2018 fue de 7300; 90 Ha, lo que evidencia que el tipo de cobertura más extenso es el Pajonal, con un área de 4405; 86 Ha, y la menos extensa el Bofedal, con 190; 71 Ha.

Agradecimientos

Al Instituto Nacional de Investigación en Glaciares y Ecosistemas de Montaña (INAIGEM), especialmente a la Dirección de Investigación en Ecosistemas de Montaña (DIEM), por el soporte técnico en el desarrollo de este estudio.

Referencias Bibliográficas

Adauto, M. y Bram,W. 2015. «Identificación de Humedales Alto Andinos Integrando Imágenes Landsat y Aster Gdem Con Árbol de Decisión Sobre La Cabecera de Las Cuencas Pisco y Pampas En Huancavelica - Perú». XVII Simpósio Brasileiro de Sensoriamento Remoto - SBSR, 1, 29 - 36.

Berhane, Tedros y et all. 2018. «Decision-Tree, Rule-Based, and Random Forest Classification of High-Resolution Multispectral Imagery forWetland Mapping and Inventory». Remote Sensing 10¹4º, 2 - 26.

Borrás, J.; Delegido, J.; Pezzola, A.; Pereira, M.; Morassi, G. y Camps-Valls, G. 2017. «Clasificación de Usos Del Suelo a Partir de Imágenes Sentinel-2». Revista de Teledeteccion ¹48º, 55 - 66.

Colditz, René. 2015.«AnEvaluation of DifferentTraining Sample Allocation Schemes for Discrete and Continuous Land Cover Classification Using Decision Tree-Based Algorithms». Remote Sensing 7¹8º, 9655 - 9681.

Huang, C.; Davis, L. y Townshend, J. 2002. «An Assessment of Support VectorMachines for Land Cover Classification». International Journal of Remote Sensing 23¹4º, 725 - 49.

Keshtkar, H. y Winfried, V. 2016. «Potential Impacts of Climate and Landscape Fragmentation Changes on Plant Distributions: Coupling Multi-Temporal Satellite Imagery with GISBased Cellular Automata Model». Ecological Informatics 32, 145 - 55.

Khatami, R.; Giorgos, M., y Stehman, S. 2016. «AMeta-Analysis of Remote Sensing Research on Supervised Pixel-Based Land-Cover Image Classification Processes: General Guidelines for Practitioners and Future Research» Remote Sensing of Environment 10¹154º, 89-100.

Landis, R. y Koch, G. 1977. «An Application of Hierarchical Kappa-Type Statistics in the Assessment ofMajority Agreement among Multiple Observers». Biometrics 33¹2º, 363 - 74.

MINAM. 2014. Protocolo: Análisis de Las Dinamicas de Cambio de Cobertura de La Tierra En La Comunidad Andina. Documento público. Ministerio de Ambiente.

MINAM. 2015.Mapa Nacional de CoberturaVegetal. Ministerio del Ambiente Direccion General de Ordenamiento Territorial Ambiental.

Minnaert, M. 1941. «The Reciprocity Principle in Lunar Photometry». The Astrophysical Journal 93.

Mora, André y et all. 2017. «LandCover Classification from Multispectral Data UsingComputational Intelligence Tools: A Comparative Study». Information (Switzerland) 8¹4º, 2 - 15

Ramana, K. y Rajesh, P. 2019. «Land Use Land Cover Classification Using a Novel Decision Tree Algorithm and Satellite Data Sets». Advances in Intelligent Systems and Computing 862, 381 - 389.

Ramos, V. y Ramirez, J. 2014. Análisis Multitemporal de La Cobertura Vegetal En La Microcuenca Quillcayhuanca, Periodo 1962 - 2013, Huaraz - Ancash. Tesis de pregrado. Universidad Nacional Santiago Antúnez deMayolo. Huaraz, Perú.

Shih, H.; Douglas, A. y Hsin, T. 2019. «Guidance on and Comparison of Machine Learning Classifiers for Landsat-Based Land Cover and Land Use Mapping» International Journal of Remote Sensing 40¹ 4º, 1248 - 74.

Shukla, Gaurav y et al. 2018. «Using Multi-Source Data and Decision Tree Classification in Mapping Vegetation Diversity». Spatial Information Research. 26¹ 5º, 573 - 85.

USGS. 2019. Landsat 8 ( L8) Data Users Handbook. USA. Vaughn Ihlen. 5th ed. Vol. 5.

Yang, Chao y et al. 2017. «Improving Land Use/Land Cover Classification by Integrating Pixel Unmixing and Decision TreeMethods». Remote Sensing 9¹ 12º, 2 - 16.

Acerca

La revista de investigación Aporte Santiaguino es una publicación científica de periodicidad semestral. Tiene como objetivo difundir los resultados de los trabajos de investigación desarrollados en los ámbitos regional, nacional e internacional, como una contribución a la solución de la problemática natural, social y cultural, La revista publica artículos científicos originales e inéditos en las Ingenierías. Los trabajos recepcionados son evaluados por árbitros externos según criterios de calidad.

Contacto

La revista de investigación Aporte Santiaguino es una publicación científica de periodicidad semestral. Tiene como objetivo difundir los resultados de los trabajos de investigación desarrollados en los ámbitos regional, nacional e internacional, como una contribución a la solución de la problemática natural, social y cultural, La revista publica artículos científicos originales e inéditos en las áreas de ingeniería. Los trabajos recepcionados son evaluados por árbitros externos según criterios de calidad.

¿ Quieres dejar tu comentario o sugerencia sobre este articulo?