Repositório de acesso aberto criado para subsidiar pesquisas sobre a doença causada pelo novo coronavírus passa a contar com dados de pacientes atendidos no Hospital das Clínicas da FM-USP, Beneficência Portuguesa, SPDM, Instituto Pensi e Real Hospital Português de Beneficência, de Recife (imagem: divulgação)
Repositório de acesso aberto criado para subsidiar pesquisas sobre a doença causada pelo novo coronavírus passa a contar com dados de pacientes atendidos no Hospital das Clínicas da FM-USP, Beneficência Portuguesa, SPDM, Instituto Pensi e Real Hospital Português de Beneficência, de Recife
Repositório de acesso aberto criado para subsidiar pesquisas sobre a doença causada pelo novo coronavírus passa a contar com dados de pacientes atendidos no Hospital das Clínicas da FM-USP, Beneficência Portuguesa, SPDM, Instituto Pensi e Real Hospital Português de Beneficência, de Recife
Repositório de acesso aberto criado para subsidiar pesquisas sobre a doença causada pelo novo coronavírus passa a contar com dados de pacientes atendidos no Hospital das Clínicas da FM-USP, Beneficência Portuguesa, SPDM, Instituto Pensi e Real Hospital Português de Beneficência, de Recife (imagem: divulgação)
Elton Alisson | Agência FAPESP – Cinco novas instituições aderiram ao COVID-19 Data Sharing/BR, o primeiro repositório de acesso aberto do país com dados demográficos e de exames clínicos e laboratoriais anonimizados de pacientes que fizeram testes para COVID-19. Lançada em junho por iniciativa da FAPESP, em parceria com a Universidade de São Paulo (USP), a iniciativa tem o objetivo de subsidiar pesquisas científicas sobre a doença nas mais diversas áreas de conhecimento.
Até o momento, a plataforma abrigava informações de pacientes, dados de desfecho e exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury, e na cidade de São Paulo pelos hospitais Sírio-Libanês e Israelita Albert Einstein.
Agora, o repositório também disponibilizará os mesmos tipos de informações fornecidas pelo Hospital das Clínicas da Faculdade de Medicina da USP (HC-FMUSP), Beneficência Portuguesa de São Paulo (BP), Associação Paulista para o Desenvolvimento da Medicina (SPDM), Instituto Pensi de Pesquisa e Ensino em Saúde Infantil – vinculado ao Hospital Infantil Sabará – e Real Hospital Português de Beneficência, em Recife (PE).
“O Hospital das Clínicas e a Faculdade de Medicina da USP se unem à FAPESP e a outras importantes instituições para ajudar no enfrentamento da COVID-19. É muito importante esta soma de esforços e reunião de informações para fortalecer as pesquisas nos diferentes centros pelo país”, avalia Tarcísio Eloy de Barros Filho, diretor da FMUSP.
O repositório já congrega dados anonimizados de mais de 332 mil pacientes, 16 mil registros de desfecho e um total de mais de 9,5 milhões de exames clínicos e laboratoriais realizados desde novembro de 2019.
Ainda que o primeiro caso da doença no Brasil tenha sido registrado em fevereiro, pelo Hospital Albert Einstein, o período de cobertura dos dados permite aos pesquisadores analisarem o histórico de saúde, bem como buscar evidências de sintomas da COVID-19 em pacientes atendidos anteriormente.
As instituições participantes da plataforma disponibilizam, além das informações, infraestrutura, tecnologias e recursos humanos próprios para viabilizar o compartilhamento de dados.
Base de dados
Os dados são disponibilizados em três categorias: demográficos (gênero, ano de nascimento e região de residência do paciente), de exames clínicos e/ou laboratoriais, além de informações, quando disponíveis, sobre a movimentação do paciente, como internações, por exemplo, e desfecho dos casos, como recuperação ou óbitos.
Em uma segunda etapa, o COVID-19 Data Sharing/BR abrigará também dados de imagens, como radiografias e tomografias.
“O repositório recebeu, em agosto, uma nova carga de dados compartilhados pelo Grupo Fleury e os hospitais Sírio-Libanês e Israelita Albert Einstein, o que permitiu aumentar o volume original de cerca de 177 mil pacientes para 330 mil pacientes e 9,5 milhões de exames” diz Cláudia Bauzer Medeiros, professora do Instituto de Computação da Universidade Estadual de Campinas (Unicamp) e participante do projeto.
“Ainda mais importante que o volume é a diversidade e qualidade dos dados, o que já está permitindo a realização de várias pesquisas de ponta”, avalia Medeiros.
Os dados das cinco novas instituições ingressantes devem começar a ser depositados em breve.
“Conseguimos reunir ao longo dos últimos meses um conjunto de dados de pacientes atendidos na BP e com alguma correlação com a COVID-19, que disponibilizados de forma colaborativa com outras instituições no repositório podem ajudar na descoberta de novas terapias e fazer predições importantes”, diz Lílian Quintal Hoffmann, diretora-executiva de tecnologia e operações da BP.
Diversos usos
De acordo com Fátima Nunes, professora da Escola de Artes, Ciências e Humanidades (EACH-USP) e diretora do Centro de Tecnologia de Informação de São Paulo, até o momento o repositório já recebeu quase 5 mil visitas e foram registrados mais de 2 mil downloads nos três conjuntos de dados.
Com base na análise dos resultados de exames laboratoriais de quase 179 mil pessoas testadas para COVID-19 no Brasil – das quais 33,2 mil com diagnóstico confirmado – disponíveis no repositório, um grupo de pesquisadores brasileiros identificou diferentes perfis clínicos da doença que são influenciados pelo sexo e pela idade do paciente, bem como pela gravidade do quadro (Leia mais em agencia.fapesp.br/33927/).
Além de fins científicos, os dados disponíveis na plataforma também têm sido utilizados por empresas para o desenvolvimento de tecnologias voltadas ao combate da COVID-19, como um sistema de inteligência artificial para auxiliar no diagnóstico e prognóstico de doenças criado pela startup DiagoNow.
A plataforma digital, que utiliza dados de pacientes para criar indicadores e auxiliar médicos a tomarem decisões clínicas, é capaz de detectar casos falso-negativos de COVID-19 com 95% de precisão utilizando apenas um hemograma.
Para chegar a esse nível de acurácia, os pesquisadores participantes do projeto utilizaram mais de 30 mil amostras de análises de hemograma disponíveis no repositório.
“No início do projeto, usamos 1,5 mil amostras de resultados de hemograma, fornecidos pelo hospital Albert Einstein, que estavam fora do repositório. Com o lançamento da plataforma, tivemos acesso a um número quase 30 vezes maior”, diz Molina Garcia, estudante de graduação em engenharia de computação na USP, em São Carlos, e head de estratégia do projeto.
“Esse aumento de amostras permitiu conferir um poder de generalização muito maior para o algoritmo usado na plataforma. Antes de utilizar os dados da base a sensibilidade era de 67% e hoje, com o uso das informações do repositório, atingiu 88%”, compara.
A plataforma processa informações de hemograma para fornecer às equipes médicas relatórios dos pacientes contendo informações que ajudam a fechar o diagnóstico. Os resultados, que saem em menos de um segundo e são mostrados em um sistema possível de ser integrado aos prontuários eletrônicos, indicam a probabilidade de o paciente estar infectado com o novo coronavírus com base nos dados de resultados de hemogramas de dezenas de milhares de outros pacientes.
“O sistema ainda não está disponível comercialmente. Hoje estamos avançando em parcerias com o Grupo Fleury e instituições como a Unimed de Florianópolis, a Santa Casa de Ourinhos e o hospital Beneficência Portuguesa de São Paulo, que estão nos ajudando no processo de validação da plataforma”, afirma Molina.
Os pesquisadores pretendem expandir a aplicação da plataforma para fazer prognóstico de COVID-19 e outras doenças. A ideia é que, por meio do hemograma e outros exames simples, seja possível prever a evolução clínica do paciente e quais recursos hospitalares ele necessitará durante o tratamento.
A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.