Saltar al contenido principal
buscar

El Fondo Común apoya una serie de Centros de Coordinación de Datos (DCC), como el Centro de recursos de datos Kids First, que proporcionan datos seleccionados derivados de cientos de estudios y muestras recopiladas de miles de sujetos humanos. Se ha generado una increíble diversidad de tipos de datos a nivel genómico., expresión, proteómico, metagenómico, y niveles de imagen, y los DCC apoyan una enorme variedad de esfuerzos de descubrimiento científico.

Sin embargo, la capacidad actual de un investigador clínico o biomédico para utilizar los recursos generados por el Fondo Común es escasa. Es difícil buscar a través todo de los conjuntos de datos del Fondo Común, y los recursos no son fácilmente utilizables en combinación. Los DCC individuales también necesitan soporte para un mejor acceso a datos protegidos., almacenamiento de datos a largo plazo, capacitación, interconexión con plataformas flexibles de análisis de datos, y disponibilidad de datos y portales de datos después del final del ciclo de vida del Programa del Fondo Común.

El ecosistema de datos del Fondo Común (CFDE) se estableció a principios 2019 para abordar los desafíos que enfrentan los usuarios finales, así como los propios DCC. Para ayudar a las DCC del Fondo Común, El CFDE apoya las necesidades individuales de DCC con inversiones específicas en interoperabilidad., autenticación/acceso a datos protegidos, capacitación, soporte del ciclo de vida del programa, y evaluación de barreras prácticas a la capacidad de encontrar datos, Accesibilidad, Interoperabilidad, y reutilización (JUSTO). La CFDE también coordina una reunión virtual mensual “polinización cruzada” seminario para conectar a los DCC en todo el Fondo Común y más allá.

Una inversión clave del CFDE es el descubrimiento de datos entre DCC. Cada uno de los DCC alberga muchos activos. (archivos de información) - p.ej., secuencia genómica, datos metagenómicos, secuencia de ARN, datos fisiológicos y metabólicos, y es difícil descubrir estos activos al otro lado de DCC. Además, La información que describe el contenido de los archivos no está disponible en un formato estandarizado.. Esto evita que los DCC hagan uso de los datos de los demás., hace que los datos sean menos detectables por otros, y desafía la interoperabilidad. Para mejorar la federación, El CFDE ha creado un portal central con una colección de inventarios derivados de datos que están alojados en los DCC.. El portal aún está en desarrollo., pero eventualmente describirá todos los activos en cada DCC y los hará visibles a través de esta interfaz centralizada..

La ventaja de este enfoque es que la formación del ecosistema no requiere que los activos de datos estén disponibles a través de un repositorio central.: Sólo se centralizan los inventarios que describen esos activos.. Catalogar todos los activos del Fondo Común es un medio simple y eficaz de liberar datos de lo que serían muchos repositorios aislados., y por lo tanto aumenta en gran medida la JUSTICIA de todos los datos del Fondo Común. Esta forma de federación de datos también se puede extender a programas financiados por otros institutos., y fácilmente vinculado a otros ecosistemas de los NIH: una vez que un sistema de inventario esté disponible, puede ser usado por cualquiera.

El CFDE también está trabajando con Seven Bridges Genomics para conectar el portal a su plataforma Cavatica, para admitir flujos de trabajo de análisis de datos personalizados. Cavatica es un producto de Seven Bridges que proporciona una interfaz fácil de usar adecuada para que usuarios de nivel principiante e intermedio realicen análisis bioinformáticos con datos de Kids First.. Cavatica proporciona una interfaz gráfica de usuario para acceder fácilmente a los datos de Kids First o importar archivos para usarlos en un editor visual que permite flujos de trabajo de análisis personalizables mediante una interfaz de apuntar y hacer clic.. El banco de trabajo Cavatica está diseñado para ser utilizado por médicos o investigadores no bioinformáticos que pueden no estar bien versados ​​en línea de comandos o programación de software.. Para usuarios más avanzados con experiencia en programación, Cavatica también ofrece la posibilidad de construir nuevas herramientas y tuberías..

Los desarrolladores de Cavatica actualmente reciben financiación bajo los auspicios del CFDE para vincular su interfaz directamente al portal del CFDE.. La implementación inicial de este sistema se espera para finales de 2021, y estará diseñado para permitir a los usuarios crear listas de carritos de compras con datos de los DCC del Fondo Común., importar esos archivos al banco de trabajo de Cavatica, y realizar análisis utilizando su sistema.

El CFDE también está creando un programa de capacitación en asociación con Kids First y otros DCC del Fondo Común para permitir a los usuarios finales hacer uso de los conjuntos de datos del CF., para acelerar la investigación básica y clínica. Este programa de entrenamiento, disponible en https://training.nih-cfde.org/, Apoyará a una amplia gama de usuarios con guías para el uso de tecnologías CFDE, así como DCC específicos.. Nuestra capacitación existente incluye una guía del portal CFDE, así como información sobre cómo utilizar el portal Kids First., y pronto se ampliará para incluir análisis de datos sobre Cavatica.

Cerrar menú