Ferramenta criada no Centro de Estudos da Metrópole (CEPID FAPESP) disponibiliza dados das pesquisas realizadas pelo IBGE entre 1960 e 2010 (foto: Agência IBGE)

Plataforma permite acesso a microdados dos censos demográficos
29 de julho de 2019

Ferramenta criada no Centro de Estudos da Metrópole (CEPID FAPESP) disponibiliza dados das pesquisas realizadas pelo IBGE entre 1960 e 2010

Plataforma permite acesso a microdados dos censos demográficos

Ferramenta criada no Centro de Estudos da Metrópole (CEPID FAPESP) disponibiliza dados das pesquisas realizadas pelo IBGE entre 1960 e 2010

29 de julho de 2019

Ferramenta criada no Centro de Estudos da Metrópole (CEPID FAPESP) disponibiliza dados das pesquisas realizadas pelo IBGE entre 1960 e 2010 (foto: Agência IBGE)

 

Agência FAPESP * – O Centro de Estudos da Metrópole (CEM), um dos Centros de Pesquisa, Inovação e Difusão (CEPIDs) financiados pela FAPESP, lançou a plataforma DataCEM, que disponibiliza microdados dos Censos Demográficos realizados pelo Instituto Brasileiro de Geografia e Estatística (IBGE) entre 1960 e 2010.

Segundo o CEM, a plataforma reduz custos de pesquisadores no tratamento de dados censitários. Ao disponibilizar os microdados do Censo, o DataCEM permite ao pesquisador produzir suas próprias tabelas.

Microdados são bancos de dados que contêm o maior detalhamento possível das informações coletadas. No caso do Censo, são os registros dos domicílios e pessoas entrevistadas. Os microdados podem ser agregados para obter informações sobre unidades maiores, conforme desejado pelo usuário: distritos, municípios, microrregiões, mesorregiões, unidades da Federação e outros.

O desenvolvimento do DataCEM foi coordenado pelo pesquisador Rogério Barbosa. “São bancos de dados com as informações individuais, porém com anonimato e sigilo garantidos, sem nenhum tipo de identificação das pessoas”, disse Barbosa.

Enquanto o portal do IBGE só disponibiliza microdados dos dois censos mais recentes, o DataCEM divulga as edições mais antigas dos censos, de 1960 a 1991. A amostra do Censo Demográfico de 1960, a mais rara, passou por processo de revisão e consistência. Ela contém informações para todas as unidades da Federação, o que a difere das divulgações públicas até então existentes.

Além disso, segundo Barbosa, o IBGE distribui as informações em um formato técnico, que pode ser de difícil compreensão e acesso para pesquisadores, especialmente os que não são muito experientes com dados quantitativos. “No DataCEM, já fizemos um pré-processamento dos dados do Censo e podemos disponibilizar apenas as variáveis que os pesquisadores precisam”, disse.

O DataCEM também ajuda o usuário no uso de recurso computacional, já que o arquivo contendo um Censo pode ter 20 gigabytes de tamanho. Softwares estatísticos geralmente abrem um arquivo inteiro do Censo Demográfico, que será armazenado na memória do computador do usuário.

A plataforma conta também com o WikiDados, um repositório de informações para consulta e textos explicativos. O WikiDados é desdobramento de alguns dos relatórios técnicos feitos pela equipe de pesquisadores do Centro de Estudos da Metrópole. Nele se explica o processo de harmonização das variáveis, se oferece um panorama do que existe em cada Censo, além de apresentar um guia sobre a utilização dos dados.

Transferência de conhecimento

O DataCEM nasceu do esforço de uma equipe de seis pessoas, coordenada por Barbosa, que tinha como responsabilidade levantar e tratar dados que seriam utilizados pelos pesquisadores que estavam trabalhando nos capítulos do livro Trajetórias das Desigualdades: Como o Brasil Mudou nos Últimos 50 Anos, publicação organizada pela professora Marta Arretche, coordenadora do CEM. Nessa etapa de produção do livro, o trabalho desse grupo foi chamado de Projeto Censo.

Para esse levantamento de dados, foram produzidos modelos estatísticos e tabelas, que precisavam ter os mesmos recortes e definições e que fossem sempre comparáveis.

Depois da publicação do livro, o CEM passou a contar com uma ampla base de dados que era usada, até então, apenas pelos próprios pesquisadores. “Então veio a ideia de disponibilizar para o público externo esse trabalho, de forma que pesquisadores externos ao CEM não precisassem fazer esse trabalho de novo. Foi uma forma de transferir o conhecimento produzido pelo CEM para a sociedade”, disse Barbosa.

* Com informações da assessoria de comunicação do CEM.
 

  Republicar
 

Republicar

A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.