Fondo: Al analizar datos de secuencia de ADN de un individuo., Saber qué nucleótido se heredó de cada padre puede resultar beneficioso a la hora de intentar identificar ciertos tipos de variantes del ADN.. La lógica de herencia mendeliana se puede utilizar para desfasar con precisión (haplotipo) la mayoría (67-83%) de las posiciones de nucleótidos heterocigotos de un individuo cuando los genotipos están disponibles para ambos padres (trío). Sin embargo, cuando todos los miembros de un trío son heterocigotos en una posición, La lógica de herencia mendeliana no se puede utilizar para realizar fases.. Para tales posiciones, Se puede utilizar un algoritmo de fase computacional.. Los algoritmos de fase existentes utilizan un panel de referencia de haplotipos, lecturas de secuenciación, y/o genotipos parentales para poner en fase a un individuo; sin embargo, están limitados porque solo pueden eliminar ciertos tipos de variantes, requieren una construcción de genotipo específica, requieren grandes cantidades de capacidad de almacenamiento, y/o requieren tiempos de ejecución prolongados. Creamos trioPhaser para abordar estos desafíos.
Resultados: trioPhaser utiliza archivos gVCF de un individuo y sus padres como entrada inicial, y luego genera un archivo VCF en fases. Los datos del trío de entrada se escalonan primero utilizando la lógica de herencia mendeliana. Entonces, las posiciones que no se pueden escalonar utilizando únicamente información de herencia se escalonan mediante el algoritmo de escalonamiento SHAPEIT4. Utilizando datos de secuenciación del genoma completo de 52 tríos, te mostramos que trioPhaser, de término medio, aumenta el número total de posiciones escalonadas en 21.0% y 10.5%, respectivamente, en comparación con el número de posiciones que SHAPEIT4 o la lógica de herencia mendeliana pueden eliminar cuando cualquiera de ellos se usa solo. Además, Mostramos que la precisión de las llamadas en fase generadas por trioPhaser es similar a la fase de lectura vinculada y de lectura respaldada..
Conclusión: trioPhaser es una herramienta de software en contenedores que utiliza lógica de herencia mendeliana y SHAPEIT4 para poner en fase tríos cuando hay archivos gVCF disponibles.. Al implementar ambos métodos de fases, Se escalonan más posiciones variantes en comparación con las que cualquiera de los métodos puede escalonar por sí solo..