26.1 C
San Justo
sábado, noviembre 27, 2021

En el 74% de los datos digitales para investigación científica no se citan cifras demográficas

La mayoría de las instituciones de salud tienen datos de imágenes clínicas a una escala que va desde decenas de miles a decenas de millones de exploraciones
La mayoría de las instituciones de salud tienen datos de imágenes clínicas a una escala que va desde decenas de miles a decenas de millones de exploraciones (DJORDJE SAVIC/)

La disponibilidad de grandes conjuntos de datos del mundo real ha sido esencial para acelerar la investigación de datos de salud, incluido el uso de datos recopilados de forma rutinaria para impulsar nuevos descubrimientos e innovaciones. Muchas de estas innovaciones utilizan métodos estadísticos y computacionales avanzados, como el aprendizaje automático (ML). Incluyen el desarrollo de algoritmos para la detección de cáncer de mama a partir de mamografías, cáncer de piel a partir de fotografías, neumonía por radiografías de tórax y retinopatía diabética a partir de imágenes del fondo de ojo de la retina, entre muchos otros.

ML también ha encontrado muchas aplicaciones dentro de la oftalmología, que incluyen segmentación de imágenes, diagnóstico automatizado, predicción de enfermedades y pronóstico. La oftalmología es particularmente adecuada para ML debido al papel crucial de las imágenes, donde las fotografías del fondo de ojo, la tomografía de coherencia óptica (OCT), las fotografías del segmento anterior y la topografía corneal se pueden aplicar a afecciones como la retinopatía diabética, la degeneración macular relacionada con la edad, el glaucoma, papiledema y cataratas.

La investigación de datos de salud de alta calidad y el desarrollo de modelos de AA requieren datos significativos a una escala suficiente. Sobre este punto, y las dificultades en el uso de datos de manera repetida (siempre el mismo grupo) es que un grupo de la Unidad Académica del Instituto de Inflamación y Envejecimiento de la Facultad de Ciencias Médicas y Dentales de la Universidad de Birmingham realizó un reciente análisis con el fin de poner atención a la mirada reductivista en muchas de las investigaciones, a pesar de la gran cantidad de datos disponibles.

estudios científicos
(Shutterstock.com)

Indudablemente, los datos existen. La mayoría de las instituciones de salud tiene datos de imágenes clínicas a una escala que va desde decenas de miles a decenas de millones de exploraciones. Sin embargo, estos datos a menudo son inaccesibles para los investigadores, incluso cuando existe la intención de ponerlos a disposición para la investigación, debido a las barreras de acceso y usabilidad. Estas pueden incluir: barreras de gobernanza (dificultades para comprender y trabajar a través de los marcos de gobernanza que regulan el uso de datos); barreras de costos (puede haber costos generales considerables para los conjuntos de datos y muchos conjuntos de datos requieren pago para acceder); y barreras de tiempo (las solicitudes y la conservación de conjuntos de datos pueden sufrir un retraso considerable antes de que estén disponibles).

Las barreras de usabilidad incluyen: el formato de datos (los datos pueden no estar en una forma computacionalmente manejable); barreras de calidad de los datos (los datos pueden ser de calidad insuficiente o incierta); y las barreras de etiquetado de imágenes (la mayoría de los proyectos de imágenes dependen del etiquetado preciso de esas imágenes, que pueden no realizarse como parte de la atención de rutina y son difíciles de hacer retrospectivamente. Para sortear estas barreras, muchos grupos de investigación recurren al uso de conjuntos de datos de imágenes disponibles públicamente. Esta ruta alternativa a menudo conduce a que utilicen los mismos conjuntos de datos dentro de un área clínica.

Así se han utilizado varias veces conjuntos de datos de imágenes públicas bien conocidas, incluidos MESSIDOR, DRIVE, EyePACS y E-ophtha. Las barreras de calidad de los datos (los datos pueden ser de calidad insuficiente o incierta); y las barreras de etiquetado de imágenes (la mayoría de los proyectos de imágenes dependen del etiquetado preciso de esas imágenes, que pueden no realizarse como parte de la atención de rutina y son difíciles de hacer retrospectivamente).

Más datos mejor guardados

Estos datos de contagios son muy similares a los de la jornada anterior, cuando el país suramericano notificó 12.141 casos de coronavirus.EFE/ Juan Ignacio Roncoroni/Archivo
Estos datos de contagios son muy similares a los de la jornada anterior, cuando el país suramericano notificó 12.141 casos de coronavirus.EFE/ Juan Ignacio Roncoroni/Archivo (EFEI0658/)

Actualmente, no existe un directorio centralizado de conjuntos de datos oftalmológicos y, por lo tanto, hay poco conocimiento sobre la cantidad de datos de imágenes oftalmológicas que están disponibles públicamente. Tampoco está claro cuál es su accesibilidad y qué tan completo es el informe de los metadatos asociados que describen las características de la imagen, las poblaciones y las enfermedades. Esta revisión tiene como objetivo identificar todos los conjuntos de datos de imágenes oftalmológicas disponibles públicamente, para crear un directorio central de lo que está disponible para el acceso actualmente. Informam la fuente de cada conjunto de datos, su accesibilidad y un resumen de las poblaciones, enfermedades y tipos de imágenes representados.

“Es muy probable -indica el líder del informe, Saad M. Khan-, que las enfermedades que se consideran mayoría o se estudian con más habitualidad sean representativas de las que se obtienen imágenes con mayor frecuencia en la práctica clínica y la investigación de rutina. En particular, en oftalmología, por ejemplo, existen programas de detección de la retinopatía diabética en varios países, lo que lleva a la acumulación de grandes datos de imágenes a nivel nacional de la población diabética”.

En todos los conjuntos de datos, la fotografía del fondo de ojo fue el tipo de imagen más común, probablemente debido a su amplia disponibilidad y uso común en una amplia gama de enfermedades oftalmológicas.

Varias variables que son clínicamente esenciales no se informaron en todos los conjuntos de datos. Los datos demográficos que incluyen edad, sexo y origen étnico no se informaron en la mayoría de los conjuntos de datos (74%), incluso a nivel agregado. Además, los criterios de inclusión y exclusión solo se definieron para el 15% de los conjuntos de datos. “Esta información faltante es motivo de preocupación, ya que no está claro si existe una representación adecuada de los grupos de población dentro de los datos, y la capacidad de los investigadores para evaluar la aplicabilidad de los resultados de la investigación a partir de estos datos estará severamente restringida”, afirma el especialista..

Para los conjuntos de datos con etiquetas de imagen (como etiquetas de diagnóstico o de características), los procesos de etiquetado también se encuentran mal definidos, según indica el documento. “Se hacen muchas suposiciones durante el etiquetado de las verdades básicas y, por lo tanto, la garantía con respecto a la precisión de la etiqueta es primordial, ya que tienen implicaciones para cualquier modelo de ML entrenado con el uso de estas etiquetas. Por lo tanto, los detalles sobre la experiencia de las etiquetadoras, el proceso de consenso utilizado para múltiples etiquetadoras y cómo se resolvieron las discrepancias son todos relevantes”, se afirma en el documento.

En los pocos conjuntos de datos que informaron esta información, los etiquetadores iban desde estudiantes de medicina, pero en la mayoría de los casos se desconocían las habilidades de los etiquetadores. Aunque el etiquetado detallado de los conjuntos de datos públicos puede ser ambicioso, una lista de verificación de elementos de metadatos de informes mínimos podría mejorar drásticamente la utilidad de los datos y también podría permitir la fusión de múltiples conjuntos de datos.

SEGUÍ LEYENDO

Coronavirus y conjuntivitis: dos nuevos estudios sugieren que la enfermedad podría manifestarse con síntomas oculares

Por qué es imprescindible la visita al médico antes de la vuelta al colegio

Últimas Noticias

MARULL: INVESTIGAN LAS CIRCUNSTANCIAS EN QUE UN HOMBRE FUE ENCONTRADO SIN VIDA

El martes por la noche, un hombre fue encontrado sin vida en la habitación de su casa. Minutos antes, se había notificado a la...

ACCIDENTE FATAL EN FREYRE: FALLECIÓ UN JOVEN DE 21 AÑOS

Un joven de 21 años falleció en la tarde noche de este martes luego de protagonizar un accidente de tránsito en el acceso norte...

SAN FRANCISCO: DOS HOMBRES FUERON DETENIDOS POR AGREDIR A SUS PAREJAS EN LA VÍA PÚBLICA

El lunes por la tarde, fue solicitada la presencia policial en inmediaciones de Av. Rosario de Santa Fe al 700 donde había una pareja...

ARROYITO: UN ADOLESCENTE FALLECIÓ TRAS ACCIDENTARSE CON SU MOTO

En horas de la mañana del día domingo, se produjo un accidente en la intersección de calles J. Vocos y Av. M. Moreno. Ene...

Te puede interesar

MARULL: INVESTIGAN LAS CIRCUNSTANCIAS EN QUE UN HOMBRE FUE ENCONTRADO SIN VIDA

El martes por la noche, un hombre fue encontrado sin vida en la habitación de su casa. Minutos antes, se había notificado a la...

ACCIDENTE FATAL EN FREYRE: FALLECIÓ UN JOVEN DE 21 AÑOS

Un joven de 21 años falleció en la tarde noche de este martes luego de protagonizar un accidente de tránsito en el acceso norte...

SAN FRANCISCO: DOS HOMBRES FUERON DETENIDOS POR AGREDIR A SUS PAREJAS EN LA VÍA PÚBLICA

El lunes por la tarde, fue solicitada la presencia policial en inmediaciones de Av. Rosario de Santa Fe al 700 donde había una pareja...

ARROYITO: UN ADOLESCENTE FALLECIÓ TRAS ACCIDENTARSE CON SU MOTO

En horas de la mañana del día domingo, se produjo un accidente en la intersección de calles J. Vocos y Av. M. Moreno. Ene...