Saltar al contenido principal
buscar

Contribuido por:

Llamar a Garimella, doctorado; Instituto amplio

Shawn Levy, Doctor; Instituto HudsonAlpha de Biotecnología

El genoma humano es complejo., y muy grande. Según el Instituto Nacional de Investigación del Genoma Humano, Un solo cromosoma puede variar en tamaño desde 50 a 300 millones de pares de bases (moléculas de ADN, siempre emparejados como A-T o C-G, que forman dos hilos retorcidos). Todo el genoma humano contiene más 3 mil millones pares de bases.

La capacidad de decodificar y examinar toda la información genética que impulsa el comportamiento de las células es increíblemente importante para la ciencia médica., y fue posible casi 2 hace décadas con la finalización del Genoma Humano de Referencia, una referencia estandarizada y un agregado de toda la información genómica y la diversidad que se encuentran en los genes humanos. Al estudiar los cánceres, defectos de nacimiento, y enfermedades raras, Los científicos pueden comparar secuencias genéticas de un individuo con este genoma de referencia estandarizado para detectar variaciones o cambios en la secuencia de ADN., que luego podría señalar las posibles causas de estas dolencias y trastornos.

Aún no es factible generar un solo, secuencia continua (o "leer") del genoma completo de una persona. Dependiendo del centro de secuenciación y de la tecnología que se utilice, El estándar para la investigación es realizar “lecturas breves” de aproximadamente 100-150 pares de bases a la vez, y luego unirlos computacionalmente para formar una secuencia genómica completa (WGS).

Las lecturas cortas se producen en un orden aleatorio y deben ensamblarse nuevamente en un genoma para intentar identificar las diferencias de interés para los investigadores.. Esto es similar a completar un rompecabezas.. Es necesario colocar todas las piezas en su lugar para poder ver el panorama completo.. Pero con secuenciación de lectura corta, ese rompecabezas puede tener cientos de millones de piezas para ensamblar.

A pesar de este desafío, La secuenciación de lectura corta ha sido la forma más disponible y rentable de examinar datos genómicos para la investigación biomédica.. en aproximadamente 15 años que la secuenciación de lectura corta ha estado disponible, El rendimiento y la precisión han mejorado constantemente.. Los costos de secuenciación han caído enormemente, permitiendo investigaciones biológicas a mayor escala. La mayor disponibilidad pública de datos ha permitido a los científicos desarrollar nuevas herramientas que pueden extraer un valor cada vez mayor de los datos.. La secuenciación de lectura corta es el método estándar para la secuenciación de genes porque se ha consolidado definitivamente como una herramienta flexible para muchos trabajos..

Pero eso no significa necesariamente que sea la herramienta adecuada para cada trabajo.

Una limitación fundamental de las lecturas breves es que son... breves., y por lo tanto tienen capacidades limitadas. No funcionan bien para detectar grandes cambios en la secuencia del ADN. (las llamadas variantes estructurales, incluyendo eliminaciones, duplicaciones, inversiones, o translocaciones que tienden a ser más largas que las lecturas cortas mismas), y para detectar variaciones en regiones repetitivas que hacen que el ensamblaje del rompecabezas de lectura corta sea mucho más difícil..

Largo-las lecturas son producidas por tipos especiales de secuenciadores. Las lecturas largas tienen muchos miles de pares de bases y pueden usarse para iluminar lugares del genoma a los que las lecturas cortas no pueden acceder ni ensamblar.. Ayudan a los investigadores a explorar variaciones estructurales en el genoma y mejorar los ensamblajes (es más fácil armar un rompecabezas cortado en 100 trozos más grandes que uno cortado en 1,000 piezas pequeñas).

Hasta hace unos años, la secuenciación de lectura larga todavía era demasiado cara, demasiado inexacto, y demasiado difícil de usar para la secuenciación regular de muchos genomas humanos. Pero eso recientemente ha comenzado a cambiar a gran escala..

Proveedores de secuenciación de lectura larga (Biociencias del Pacífico – PB, y nanoporo de Oxford – ONT) lanzaron versiones de sus instrumentos que aumentaron enormemente el rendimiento de lectura larga en comparación con iteraciones anteriores. La precisión aumentó sustancialmente y los costos de secuenciación disminuyeron en un orden de magnitud. La mayor disponibilidad de datos permitió una vez más el desarrollo de novedosos métodos de software para capitalizar las mejoras y ofrecer nuevas capacidades de análisis.. En concierto, Estos cambios permiten generar y procesar datos de secuenciación de lectura larga a la escala requerida para estudios de pacientes humanos..

Ahora, bajo su programa piloto de secuenciación de lectura larga, Programa de investigación pediátrica Kids First Gabriella Miller del Fondo Común de los NIH (Los niños primero) está trabajando para aprovechar estas tecnologías que avanzan rápidamente para descubrir la variación estructural genética subyacente a los cánceres infantiles y los defectos estructurales de nacimiento..

Los dos centros de secuenciación del genoma de Kids First, Instituto HudsonAlpha de Biotecnología y Instituto Broad, se fundaron con la premisa de traer las tecnologías de secuenciación más apropiadas y avanzadas, de una manera muy apoyada, a los investigadores seleccionados en el programa Kids First. El programa piloto de lectura larga es una extensión de los esfuerzos en curso de secuenciación de lectura corta para proporcionar a los investigadores de Kids First y a la comunidad de investigación en general los mejores recursos disponibles para revelar conocimientos novedosos o datos de mayor resolución para estas cohortes y muestras únicas.. Actualmente hay siete estudios de investigación que participan en el Programa piloto Kids First Long Read.

Dirigido por el investigador principal Dr.. Sharon Plon de Baylor College of Medicine y secuenciado por HudsonAlphia es un proyecto para realizar secuenciación de lectura larga de la cohorte BASIC3. El proyecto espera mejorar nuestra comprensión colectiva de la susceptibilidad al cáncer pediátrico mediante el análisis de la variación estructural de la línea germinal mediante secuenciación del genoma completo de lectura larga..

Investigador Principal Dr.. Bruce Gelb de la Escuela de Medicina Icahn en Mount Sinai está liderando un estudio que involucra secuencias genómicas completas de lectura larga generadas en el Instituto Broad., centrado en defectos cardíacos congénitos (enfermedad coronaria). Su equipo espera utilizar secuenciación de lectura larga para identificar variantes estructurales y repeticiones genéticas que podrían ser un factor que contribuya al desarrollo de la enfermedad coronaria en algunos pacientes..

Avances continuos en la calidad de lectura, longitud de lectura, y la rentabilidad en la producción de datos nos han llevado a un interesante punto de inflexión. La tecnología Oxford Nanopore continúa mejorando la química y la precisión de la lectura mientras mantiene la capacidad de generar lecturas de cientos de miles a millones de pares de bases.. Pacific Biosciences continúa mejorando el rendimiento y la calidad de su plataforma. Y el Secuenciación de consenso circular (CCS) Se puede considerar que el método de Pacific Biosciences combina las mejores características de la secuenciación de lectura corta tradicional, donde la precisión de la lectura se mejora al detectar la misma secuencia varias veces.. CCS permite detectar miles de pares de bases en una sola lectura, pero se detecta la lectura 7 a 12 veces en replicar, desarrollando una secuenciación altamente precisa para ese segmento.

Uno de los desafíos asociados con las tecnologías de lectura prolongada es que cada una de ellas requiere muestras de ADN de muy alta calidad.. Antes de ser cargado en una máquina secuenciadora, Las moléculas de ADN deben extraerse de las células., un procedimiento de alteraciones físicas y químicas que también puede romper las delicadas cadenas de nucleótidos. Una extracción demasiado bruta podría desgarrar el ADN en pequeños trozos no aptos para una secuenciación de lectura prolongada. Kids First DRC y sus socios del centro de secuenciación están trabajando con los investigadores que aportan muestras para asegurarse de que sean de la calidad suficiente para maximizar los beneficios de la tecnología de lectura prolongada..

El compromiso del programa Gabriella Miller Kids First de respaldar la secuenciación de lectura larga está ayudando a centrar la atención en áreas del genoma o clases de variantes que pueden no estar suficientemente informadas o no pueden detectarse con una sola tecnología.. Cuando se combina, Los esfuerzos de lectura larga y corta se aprovecharán mutuamente para avanzar en los descubrimientos de las vías subyacentes a estas afecciones pediátricas.. Es importante tener en cuenta que una tecnología no reemplazará a la otra ni sustituirá completamente a la otra.. Esta es una oportunidad para brindar más herramientas a los investigadores y una caja de herramientas..

Cerrar menú