Grupo do Inpe aprimora método para mapear uso e cobertura do solo a partir de imagens de satélite

Republicar

A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.

Agência FAPESP* –Karina Ninni | Agência FAPESP – Imagens de satélite são usadas para diversos fins, entre os quais o mapeamento de uso e cobertura do solo (Lulc, na sigla em inglês). Segundo um grupo de pesquisadores do Instituto Nacional de Pesquisas Espaciais (Inpe), o uso dessas “fotografias” pode ser aperfeiçoado se esse material passar pelo crivo de experts antes de ser analisado com a ajuda de algoritmos e outras ferramentas computacionais.

A equipe publicou na revista Forests um trabalho sobre o mapeamento de uso e cobertura do solo do Estado de São Paulo. Nele, levou em conta a expertise dos cientistas na pré-seleção das imagens para classificação do uso e da cobertura do solo em seis categorias: floresta, plantação florestal, corpos d’água, áreas urbanas, agricultura e pastagem.

De acordo com os dados obtidos pelo grupo, as áreas florestais concentram-se principalmente na região leste de São Paulo, predominantemente em encostas mais íngremes, respondendo por 19% da área de estudo. A pastagem e a agricultura dominam 73% da paisagem paulista, respondendo, respectivamente, por 39% e 34%. Para validar os resultados, a equipe os comparou à classificação do Projeto MapBiomas (rede colaborativa que produz mapeamento anual da cobertura e do uso da terra), obtendo uma acurácia geral de 85,47%.

“A novidade do método proposto consiste em selecionar as imagens com base nas características espectrais e temporais de classes predefinidas de Lulc. Primeiro, definimos as seis classes que seriam mapeadas no ano de 2020. Depois, analisamos visualmente suas características espectrais de variabilidade ao longo do ano, para selecionar aquelas que melhoram cada classe de Lulc, individualmente, nas imagens. Em seguida, pré-processamos essas imagens para gerar um mapa destacando cada classe de Lulc”, resume o primeiro autor do artigo, Yosio Edemir Shimabukuro, pesquisador da Divisão de Observação da Terra e Geoinformática (DIOTG) do Inpe.

Classificação

A equipe usou dois mosaicos de imagens do satélite Landsat-8 Operational Land Imager (OLI), da Nasa (agência espacial norte-americana): 379 capturadas de janeiro a junho de 2020 (final da estação chuvosa e início da seca) e 212 feitas de maio a setembro (estação seca). Com base nesses mosaicos, investigou o período temporal mais adequado para classificar cada categoria.

“Um mosaico anual – no nosso caso, de janeiro a dezembro de 2020 – ajuda a melhorar a classificação dos corpos d’água. Já para identificar as classes urbana e florestal, os melhores resultados foram alcançados com imagens de maio a setembro de 2020, que é a estação seca. Para a classificação da agricultura, utilizamos imagens de janeiro a junho de 2020, período que destaca a categoria, por ser época de cultivo”, explica Egídio Arai, coautor do artigo.

Segundo ele, o grupo começou classificando a água, que é uma tarefa mais fácil, seguida por área urbana, floresta, agricultura e, por último, as áreas de floresta plantada. “Assumimos que todas as áreas restantes estavam cobertas por pastagens.”

Classificar as florestas plantadas exigiu a utilização de imagens de maio a setembro do período de 2013 a 2020. “A diferença da floresta plantada para a permanente é justamente a temporalidade. Por isso, usamos imagens de 2013 a 2020. Sabemos que, no Estado de São Paulo, o que mais se planta é eucalipto, que tem ciclo de corte de cinco a sete anos. Assim, se eu usar imagens de um único ano, e calhar de ser justamente quando as árvores foram cortadas, não vou entender que é uma floresta plantada. Ela tem muitos ciclos de corte, então é preciso mostrar ao algoritmo que ele terá de usar muitas imagens para classificar aquele tipo de vegetação”, explica Gabriel Máximo da Silva, doutorando em sensoriamento remoto no Inpe.

As classes de uso e cobertura do solo foram categorizadas individualmente com o uso de bandas espectrais específicas, índices espectrais (resultado de operações matemáticas entre valores numéricos de pixels das bandas de uma imagem) e também imagens de fração (geradas a partir de um modelo linear de mistura espectral). O grupo empregou um algoritmo classificador conhecido como Random Forest, disponível na plataforma Google Earth Engine (GEE), para a classificação das imagens em cada classe Lulc. “Por meio de diferentes processamentos, procuramos realçar cada categoria de interesse, utilizando as bandas espectrais originais e tentando destacar cada alvo”, relata Shimabukuro.

O artigo publicado na Forests é apenas um dos resultados do projeto “Análise espaço-temporal do uso e cobertura da terra no estado de São Paulo utilizando técnicas de sensoriamento remoto”, coordenado por Shimabukuro e financiado pela FAPESP. O objetivo geral foi mapear, monitorar e analisar as mudanças no uso e cobertura da terra entre 1970 e 2020 no Estado de São Paulo, por meio de sensoriamento remoto e geoprocessamento.

Nuvens

Uma das dificuldades do uso dessas técnicas, segundo Arai, são as nuvens que encobrem, nas imagens, aquilo que se quer visualizar. De acordo com o pesquisador, mesmo restringindo o período estudado, ainda há nuvens e sombras nas imagens. Isso sem contar a dificuldade do próprio algoritmo que, mesmo sendo bastante preciso, tem seus limites.

“O algoritmo filtra as nuvens, tirando-as das imagens, e ainda leva em conta os percentis da série histórica [cada uma das partes, na divisão da amostragem em cem partes]. Assim, é possível selecionar visualmente os melhores percentis para fazer a classificação. Só que, mesmo com o filtro do algoritmo, restam nas imagens as sombras ou pedaços de nuvens, ou ainda nuvens menos espessas. O Landsat tem uma resolução temporal de 16 dias. Num período chuvoso é complicado conseguir imagens sem nuvens.”

No projeto apoiado pela FAPESP, como a intenção era avaliar um período longo, a maior cobertura é do Landsat, mas o grupo lançou mão de imagens dos outros satélites também, como Sentinel-2 MSI; Terra MODIS; PROBA-V; CBERS-4 WFI, MUX, PAN; SRTM; RapidEye; Worldview, VIIRS, entre outros. Cada um deles agrega diferentes resoluções, tanto temporais quanto espaciais.

“É possível usar imagens de todos eles, em conjunto: por exemplo, os dados do Landsat com o melhor do Sentinel-2 MSI, que é a resolução espacial, e o melhor no MODIS, que é a resolução temporal, quase diária. O Sentinel tem uma resolução espacial de 10 metros; no Landsat, ela é de 30 metros. Então, haveria mais detalhes espaciais com o Sentinel. No MODIS, a possibilidade de conseguir imagens sem nuvens é maior, por conta da resolução temporal, mas a resolução espacial dele é pobre. Então, pode-se utilizar a resolução espacial do Landsat. Eu não me lembro de ver outros trabalhos empregando vários sensores combinados para obter uma melhor classificação de uso e cobertura do solo”, ressalta Arai.

Replicabilidade e referência

Segundo os cientistas, tentar melhorar a classificação pré-selecionando as imagens e categorizando primeiramente as paisagens mais fáceis aparentemente reduz a ocorrência de erros de classificação. “Creio que, nesse sentido, o trabalho traz uma contribuição para a discussão e a compreensão das mudanças de uso e cobertura do solo no contexto dos esforços gerais para entender seus impactos nas mudanças climáticas globais. Também é mais uma ferramenta disponível para os tomadores de decisão”, afirma Silva.

Shimabukuro assegura que a metodologia pode ser aplicada em outros lugares, mas deve ser adaptada às condições locais. “O mais importante é unir o conhecimento específico dos especialistas sobre a área à obtenção e ao processamento de imagens. Os intervalos temporais que utilizamos para a análise do Estado de São Paulo podem não servir para um mapeamento do Nordeste ou da Amazônia. A agricultura, por exemplo, pode ter períodos de safra e entressafra diferentes para cada região, mas a metodologia pode ser adaptada. O que se viu na Amazônia em 2023 hoje ilustra bem o que digo: a maior seca em décadas. Se quiséssemos classificar corpos d’água, por exemplo, esse período seria o pior de todos”, esclarece, acrescentando que o ideal seria o período chuvoso, mais precisamente o final, quando ocorre o pico da cheia.

“Publicamos um trabalho na Acta Amazônica no qual avaliamos a variação do rio Negro no evento de 2010. Usamos imagens do final de junho e outras de setembro e outubro. Vimos a diferença da cobertura de água naquele ano. É nesse sentido que a metodologia depende do conhecimento da equipe sobre o local, sendo a grande contribuição do trabalho. Facilitamos o trabalho do computador, já separando as imagens a serem processadas para cada alvo.”

Segundo ele, o método tem também a vantagem de servir de referência para a comunidade científica, pois sabe-se exatamente como os mapas finais foram obtidos. “Trata-se, portanto, de uma contribuição não somente para os gestores públicos, como também para a comunidade científica que estuda o Estado de São Paulo.”

O artigo Mapping Land Use and Land Cover Classes in São Paulo State, Southeast of Brazil, Using Landsat-8 OLI Multispectral Data and the Derived Spectral Indices and Fraction Images pode ser lido em: www.mdpi.com/1999-4907/14/8/1669.

<p><strong>Karina Ninni | Agência FAPESP</strong> – Imagens de satélite são usadas para diversos fins, entre os quais o mapeamento de uso e cobertura do solo (Lulc, na sigla em inglês). Segundo um grupo de pesquisadores do Instituto Nacional de Pesquisas Espaciais (Inpe), o uso dessas “fotografias” pode ser aperfeiçoado se esse material passar pelo crivo de <em>experts</em> antes de ser analisado com a ajuda de algoritmos e outras ferramentas computacionais.</p>

<p>A equipe <strong><a href="https://www.mdpi.com/1999-4907/14/8/1669" target="_blank">publicou</a></strong> na revista <em>Forests</em> um trabalho sobre o mapeamento de uso e cobertura do solo do Estado de São Paulo. Nele, levou em conta a expertise dos cientistas na pré-seleção das imagens para classificação do uso e da cobertura do solo em seis categorias: floresta, plantação florestal, corpos d’água, áreas urbanas, agricultura e pastagem.</p>

<p>De acordo com os dados obtidos pelo grupo, as áreas florestais concentram-se principalmente na região leste de São Paulo, predominantemente em encostas mais íngremes, respondendo por 19% da área de estudo. A pastagem e a agricultura dominam 73% da paisagem paulista, respondendo, respectivamente, por 39% e 34%. Para validar os resultados, a equipe os comparou à classificação do Projeto MapBiomas (rede colaborativa que produz mapeamento anual da cobertura e do uso da terra), obtendo uma acurácia geral de 85,47%.</p>

<p>“A novidade do método proposto consiste em selecionar as imagens com base nas características espectrais e temporais de classes predefinidas de Lulc. Primeiro, definimos as seis classes que seriam mapeadas no ano de 2020. Depois, analisamos visualmente suas características espectrais de variabilidade ao longo do ano, para selecionar aquelas que melhoram cada classe de Lulc, individualmente, nas imagens. Em seguida, pré-processamos essas imagens para gerar um mapa destacando cada classe de Lulc”, resume o primeiro autor do artigo, <strong><a href="https://bv.fapesp.br/pt/pesquisador/6107/yosio-edemir-shimabukuro/" target="_blank">Yosio Edemir Shimabukuro</a></strong>, pesquisador da Divisão de Observação da Terra e Geoinformática (DIOTG) do Inpe.</p>

<p><strong>Classificação</strong></p>

<p>A equipe usou dois mosaicos de imagens do satélite Landsat-8 Operational Land Imager (OLI), da Nasa (agência espacial norte-americana): 379 capturadas de janeiro a junho de 2020 (final da estação chuvosa e início da seca) e 212 feitas de maio a setembro (estação seca). Com base nesses mosaicos, investigou o período temporal mais adequado para classificar cada categoria.</p>

<p>“Um mosaico anual – no nosso caso, de janeiro a dezembro de 2020 – ajuda a melhorar a classificação dos corpos d’água. Já para identificar as classes urbana e florestal, os melhores resultados foram alcançados com imagens de maio a setembro de 2020, que é a estação seca. Para a classificação da agricultura, utilizamos imagens de janeiro a junho de 2020, período que destaca a categoria, por ser época de cultivo”, explica Egídio Arai, coautor do artigo.</p>

<p>Segundo ele, o grupo começou classificando a água, que é uma tarefa mais fácil, seguida por área urbana, floresta, agricultura e, por último, as áreas de floresta plantada. “Assumimos que todas as áreas restantes estavam cobertas por pastagens.”</p>

<p>Classificar as florestas plantadas exigiu a utilização de imagens de maio a setembro do período de 2013 a 2020. “A diferença da floresta plantada para a permanente é justamente a temporalidade. Por isso, usamos imagens de 2013 a 2020. Sabemos que, no Estado de São Paulo, o que mais se planta é eucalipto, que tem ciclo de corte de cinco a sete anos. Assim, se eu usar imagens de um único ano, e calhar de ser justamente quando as árvores foram cortadas, não vou entender que é uma floresta plantada. Ela tem muitos ciclos de corte, então é preciso mostrar ao algoritmo que ele terá de usar muitas imagens para classificar aquele tipo de vegetação”, explica Gabriel Máximo da Silva, doutorando em sensoriamento remoto no Inpe.</p>

<p>As classes de uso e cobertura do solo foram categorizadas individualmente com o uso de bandas espectrais específicas, índices espectrais (resultado de operações matemáticas entre valores numéricos de pixels das bandas de uma imagem) e também imagens de fração (geradas a partir de um modelo linear de mistura espectral). O grupo empregou um algoritmo classificador conhecido como Random Forest, disponível na plataforma Google Earth Engine (GEE), para a classificação das imagens em cada classe Lulc. “Por meio de diferentes processamentos, procuramos realçar cada categoria de interesse, utilizando as bandas espectrais originais e tentando destacar cada alvo”, relata Shimabukuro.</p>

<p>O artigo publicado na <em>Forests</em> é apenas um dos resultados do projeto “<strong><a href="https://bv.fapesp.br/pt/auxilios/106527/analise-espaco-temporal-do-uso-e-cobertura-da-terra-no-estado-de-sao-paulo-utilizando-tecnicas-de-se/" target="_blank">Análise espaço-temporal do uso e cobertura da terra no estado de São Paulo utilizando técnicas de sensoriamento remoto</a></strong>”, coordenado por Shimabukuro e financiado pela FAPESP. O objetivo geral foi mapear, monitorar e analisar as mudanças no uso e cobertura da terra entre 1970 e 2020 no Estado de São Paulo, por meio de sensoriamento remoto e geoprocessamento.</p>

<p><strong>Nuvens</strong></p>

<p>Uma das dificuldades do uso dessas técnicas, segundo Arai, são as nuvens que encobrem, nas imagens, aquilo que se quer visualizar. De acordo com o pesquisador, mesmo restringindo o período estudado, ainda há nuvens e sombras nas imagens. Isso sem contar a dificuldade do próprio algoritmo que, mesmo sendo bastante preciso, tem seus limites.</p>

<p>“O algoritmo filtra as nuvens, tirando-as das imagens, e ainda leva em conta os percentis da série histórica [cada uma das partes, na divisão da amostragem em cem partes]. Assim, é possível selecionar visualmente os melhores percentis para fazer a classificação. Só que, mesmo com o filtro do algoritmo, restam nas imagens as sombras ou pedaços de nuvens, ou ainda nuvens menos espessas. O Landsat tem uma resolução temporal de 16 dias. Num período chuvoso é complicado conseguir imagens sem nuvens.”</p>

<p>No projeto apoiado pela FAPESP, como a intenção era avaliar um período longo, a maior cobertura é do Landsat, mas o grupo lançou mão de imagens dos outros satélites também, como Sentinel-2 MSI; Terra MODIS; PROBA-V; CBERS-4 WFI, MUX, PAN; SRTM; RapidEye; Worldview, VIIRS, entre outros. Cada um deles agrega diferentes resoluções, tanto temporais quanto espaciais.</p>

<p>“É possível usar imagens de todos eles, em conjunto: por exemplo, os dados do Landsat com o melhor do Sentinel-2 MSI, que é a resolução espacial, e o melhor no MODIS, que é a resolução temporal, quase diária. O Sentinel tem uma resolução espacial de 10 metros; no Landsat, ela é de 30 metros. Então, haveria mais detalhes espaciais com o Sentinel. No MODIS, a possibilidade de conseguir imagens sem nuvens é maior, por conta da resolução temporal, mas a resolução espacial dele é pobre. Então, pode-se utilizar a resolução espacial do Landsat. Eu não me lembro de ver outros trabalhos empregando vários sensores combinados para obter uma melhor classificação de uso e cobertura do solo”, ressalta Arai.</p>

<p><strong>Replicabilidade e referência</strong></p>

<p>Segundo os cientistas, tentar melhorar a classificação pré-selecionando as imagens e categorizando primeiramente as paisagens mais fáceis aparentemente reduz a ocorrência de erros de classificação. “Creio que, nesse sentido, o trabalho traz uma contribuição para a discussão e a compreensão das mudanças de uso e cobertura do solo no contexto dos esforços gerais para entender seus impactos nas mudanças climáticas globais. Também é mais uma ferramenta disponível para os tomadores de decisão”, afirma Silva.</p>

<p>Shimabukuro assegura que a metodologia pode ser aplicada em outros lugares, mas deve ser adaptada às condições locais. “O mais importante é unir o conhecimento específico dos especialistas sobre a área à obtenção e ao processamento de imagens. Os intervalos temporais que utilizamos para a análise do Estado de São Paulo podem não servir para um mapeamento do Nordeste ou da Amazônia. A agricultura, por exemplo, pode ter períodos de safra e entressafra diferentes para cada região, mas a metodologia pode ser adaptada. O que se viu na Amazônia em 2023 hoje ilustra bem o que digo: a maior seca em décadas. Se quiséssemos classificar corpos d’água, por exemplo, esse período seria o pior de todos”, esclarece, acrescentando que o ideal seria o período chuvoso, mais precisamente o final, quando ocorre o pico da cheia.</p>

<p>“Publicamos um trabalho na <em>Acta Amazônica</em> no qual avaliamos a variação do rio Negro no evento de 2010. Usamos imagens do final de junho e outras de setembro e outubro. Vimos a diferença da cobertura de água naquele ano. É nesse sentido que a metodologia depende do conhecimento da equipe sobre o local, sendo a grande contribuição do trabalho. Facilitamos o trabalho do computador, já separando as imagens a serem processadas para cada alvo.”</p>

<p>Segundo ele, o método tem também a vantagem de servir de referência para a comunidade científica, pois sabe-se exatamente como os mapas finais foram obtidos. “Trata-se, portanto, de uma contribuição não somente para os gestores públicos, como também para a comunidade científica que estuda o Estado de São Paulo.”</p>

<p>O artigo <em>Mapping Land Use and Land Cover Classes in São Paulo State, Southeast of Brazil, Using Landsat-8 OLI Multispectral Data and the Derived Spectral Indices and Fraction Images</em> pode ser lido em: <strong><a href="https://www.mdpi.com/1999-4907/14/8/1669" target="_blank">www.mdpi.com/1999-4907/14/8/1669</a></strong>.<br />
 </p>