Esta plataforma hospeda más de 50 millones de datos de 800 mil pacientes de Brasil y ha registrado alrededor de 4.000 descargas de usuarios de 36 países (imagen: reproducción)

El repositorio COVID-19 Data Sharing/BR propicia descubrimientos en las áreas de salud y computación
15-07-2021
PT EN

Esta plataforma hospeda más de 50 millones de datos de 800 mil pacientes de Brasil y ha registrado alrededor de 4.000 descargas de usuarios de 36 países

El repositorio COVID-19 Data Sharing/BR propicia descubrimientos en las áreas de salud y computación

Esta plataforma hospeda más de 50 millones de datos de 800 mil pacientes de Brasil y ha registrado alrededor de 4.000 descargas de usuarios de 36 países

15-07-2021
PT EN

Esta plataforma hospeda más de 50 millones de datos de 800 mil pacientes de Brasil y ha registrado alrededor de 4.000 descargas de usuarios de 36 países (imagen: reproducción)

 

Por Elton Alisson  |  Agência FAPESP – Un año después de su presentación, el repositorio COVID-19 Data Sharing/BR lleva registradas alrededor de 4.000 descargas de su colección de más de 50 millones de datos referentes a 800 mil pacientes, de usuarios de 36 países.

“Aspiramos a que el COVID-19 Data Sharing/BR constituya la base sobre la cual logremos motivar a la comunidad científica a compartir información generada con calidad para producir nuevos conocimientos”, dijo Luiz Eugênio Mello, director científico de la FAPESP. “El intercambio de datos es una nueva forma de hacer ciencia, y la FAPESP pretende avanzar cada vez más en esa dirección.”

Este repositorio, pionero en Latinoamérica, es una iniciativa de la FAPESP en cooperación con la Universidad de São Paulo (USP), y su objetivo consiste en poner a disposición en forma totalmente abierta datos relacionados con el COVID-19 que puedan aportar a las investigaciones referentes a la enfermedad. Este material ha hecho posibles descubrimientos tanto en el área de la salud como en la de la computación.

Algunos de los resultados de investigaciones realizadas con base en los registros disponibles en la plataforma se dieron a conocer durante el evento online El repositorio COVID-19 Data Sharing/BR: datos abiertos en el combate contra la pandemia, realizado el pasado 18 de junio, con ocasión de cumplirse entonces el primer año de la plataforma.

La misma cuenta actualmente con más de 50 millones de registros, en su mayor parte de resultados de análisis clínicos de más de 800 mil pacientes, además de más de 300 mil registros de desenlaces.

En Brasil, investigadores de todos los estados del país han venido utilizando estos datos. “Casi la mitad de las descargas realizadas en el país corrieron por cuenta de usuarios de fuera de São Paulo. Esto indica posiblemente su empleo en investigaciones colaborativas a cargo de varios centros”, dijo Fátima Nunes, docente de la USP y participante en el proyecto.

Los datos incluyen información demográfica y de análisis clínicos y de laboratorio anonimizados, de pacientes que requirieron algún tipo de estudio relacionado con el COVID-19.

“Esos datos quedan disponibles en forma individual, pero los pacientes no pueden quedar identificados. Por eso se verifica antes de compartir la información, de manera tal que las referencias demográficas de los pacientes solamente puedan informarse si las combinaciones permiten un agrupamiento mínimo de los mismos”, explicó Gabriela Barnabé, consultora de la FAPESP y coordinadora de ciencia de datos de la cadena Globo.

La arquitectura del COVID-19 Data Sharing/BR se basó en la Red de Repositorios de Datos de Investigación del Estado de São Paulo, cuya construcción se extendió durante tres años y reunió a cien personas entre gestores universitarios, investigadores y técnicos de la USP y de las universidades de Campinas (Unicamp) y Estadual Paulista (Unesp), de las universidades federales de São Paulo (Unifesp), del ABC (UFABC) y de São Carlos (UFSCar) y del Instituto Tecnológico de Aeronáutica (ITA).

“Juntas, dichas instituciones construyeron sus repositorios y exportan sus metadatos a una interfaz única, disponible para el mundo. Es una infraestructura de datos abiertos pionera en América Latina”, dijo Claudia Bauzer Medeiros, docente del Instituto de Computación de la Unicamp y coordinadora del proyecto de la referida red.

Toda vez que la Red de Repositorios se proyectó para ser extensible y para la apertura de datos, fue posible crear y acoplar el COVID-19 Data Sharing/BR en 15 días. En otras situaciones, este proceso habría tardado varios meses.

“Para finales de junio tendremos datos muy recientes de la mayoría de los socios, que ya están procesándose, pero deben pasar por todo un proceso de revalidación para quedar disponibles en la plataforma”, dijo en la oportunidad Bauzer Medeiros.

“La diferencia con relación a otros repositorios reside en la variedad de datos, que incluyen centenas de tipos de análisis, por ejemplo, lo que permite llevar a cabo estudios de comorbilidades. Aún está explorándose el potencial para el avance del conocimiento en muchas áreas”, sostuvo la investigadora.

Con base en los datos que ya se encuentran disponibles en el repositorio, científicos del Instituto de Ciencias Matemáticas y Computación (ICMC) de la USP desarrollaron herramientas de visualización de datos interoperables sobre COVID-19, manipulados como grafos, para observar y entender las relaciones entre los mismos.

Una de las técnicas desarrolladas, denominada Interoperable Covid Visualizer² (I-CovidVis), permite efectuar un seguimiento de la evolución de un paciente con la enfermedad durante su internación, integrando los resultados de análisis de parámetros de laboratorio obtenidos en diferentes tipos de analitos.

“Esta herramienta permite que un experto visualice los resultados de los análisis de cualquier conjunto de analitos en una determinada franja de tiempo. De esta forma, logra obtener de manera muy rápida la información que necesita para tomar decisiones”, explicó Agma Traina, docente del ICMC-USP y coordinadora del proyecto.

Los datos disponibles en el repositorio también hicieron posible la creación de un sistema sofisticado de consultas utilizando el lenguaje natural para establecer correlaciones entre los datos de laboratorio y los pacientes.

“Un punto importante adicional en este tipo de investigaciones consiste en permitir que los no expertos en computación puedan analizar estos datos en el lenguaje común y corriente, en lugar de hacerlo con lenguajes especializados de programación para datos”, dijo Marco Antonio Casanova, docente de la Pontificia Universidad Católica de Río de Janeiro (PUC-Río).

“El hecho de que la información quede abierta nos permitió poner a prueba y validar nuestra plataforma con un gran volumen de datos reales”, afirmó.

Una mayor respuesta inflamatoria

Otro estudio, en el área de la salud, realizado con base en datos disponibles en el repositorio y a cargo de investigadores de diversas instituciones de Brasil y del exterior, apuntó por qué los varones y los ancianos exhiben una mayor susceptibilidad para desarrollar COVID-19 grave.

Al analizar los resultados de análisis de laboratorio de más de 178 mil pacientes testeados para COVID-19 y disponibles en el repositorio, los investigadores constataron que la enfermedad induce alteraciones análogas en los parámetros de laboratorio de varones y mujeres. Con todo, los pacientes ancianos del sexo masculino presentaron indicadores de laboratorio significativamente más anormales, incluidos niveles más elevados de marcadores inflamatorios en comparación con las mujeres ancianas.

Los resultados de este estudio, apoyado por la FAPESP, salieron publicados en el International Journal of Infectious Diseases.

“Observamos que los niveles de marcadores de inflamación en pacientes diagnosticados con COVID-19 y en estado grave aparecían sumamente elevados y variaban de acuerdo con el sexo y con la edad”, dijo Helder Nakaya, vicedirector de la Facultad de Ciencias Farmacéuticas (FCF-USP) y coordinador del estudio.

Inmediatamente después de que quedó disponible la primera carga de datos en el repositorio, los científicos analizaron mediante el empleo de técnicas de bioinformática los resultados de los estudios de laboratorio de más de 33 mil pacientes con diagnósticos positivos de COVID-19 suministrados por el grupo Fleury y por los hospitales Sírio-Libanês e Israelita Albert Einstein.

Los pacientes en su mayor parte fueron diagnosticados mediante test de RT-PCR, la prueba considerada como el patrón oro para la detección de la enfermedad.

Los resultados de los estudios indicaron que los niveles de proteína C reactiva (PCR) y ferritina −producidas por el hígado y cuya concentración sanguínea aumenta en razón de procesos inflamatorios o infecciosos–, por ejemplo, aparecían aumentados especialmente en varones de más edad y con COVID-19.

También se observaron niveles anormales de enzimas de función hepática –que indican la infección de los riñones– en varios grupos de edades, excepto entre mujeres jóvenes.

“Este trabajo puede ayudar a orientar nuevas investigaciones sobre la patogénesis del COVID-19 y contribuir al desarrollo de modelos predictivos de la infección provocada por el SARS-CoV-2 y de la evolución hacia cuadros graves de la enfermedad”, afirmó Nakaya (lea más en: agencia.fapesp.br/34206/). 

Los investigadores están desarrollando ahora métodos de aprendizaje de máquinas para analizar una nueva carga de resultados de estudios de pacientes diagnosticados con COVID-19 disponibles en el repositorio, la cual incluye también datos suministrados por el Hospital de Clínicas de la Facultad de Medicina de la USP (HC-FM-USP) y del hospital Beneficência Portuguesa de São Paulo (BP).

Uno de los objetivos de este trabajo consistirá en identificar los desenlaces y las interacciones entre diversos parámetros de laboratorio.

“Pretendemos también analizar con mayor nivel de detalle lo que sucede con los parámetros de laboratorio de pacientes diagnosticados con COVID-19 y con otros tipos de infecciones, como el dengue”, afirmó Nakaya.

Este evento contó con la coordinación por Roberto Marcondes César, docente de la USP y miembro de la coordinación del Programa de Centros de Investigación, Innovación y Difusión (CEPIDs), de la FAPESP, en tanto que la moderación de las preguntas estuvo a cargo de João Eduardo Ferreira, superintendente de tecnología de la información de la USP. Ambos son miembros de la coordinación de desarrollo técnico del repositorio.

También participaron en el evento Luiz Fernando Lima Reis, superintendente de investigación del Hospital Sírio-Libanês; Luiz Vicente Rizzo, director de investigación de la Sociedade Beneficente Israelita Brasileira Albert Einstein, Edgar Rizzati, director ejecutivo médico y técnico del grupo Fleury, y Geraldo Busatto, del Hospital de Clínicas de la FM-USP, en representación de las instituciones que toman parte en la plataforma.

Puede accederse al evento completo en el siguiente enlace: www.youtube.com/watch?v=qHlKOMAtM1Q.
 

  Republicar
 

Republicar

The Agency FAPESP licenses news via Creative Commons (CC-BY-NC-ND) so that they can be republished free of charge and in a simple way by other digital or printed vehicles. Agência FAPESP must be credited as the source of the content being republished and the name of the reporter (if any) must be attributed. Using the HMTL button below allows compliance with these rules, detailed in Digital Republishing Policy FAPESP.