Accurate in silico confirmation of rare copy number variant calls from exome sequencing data using transfer learning.

Exome sequencing is widely used in genetic studies of human diseases and
clinical genetic diagnosis. Accurate detection of copy number variants
(CNVs) is important to fully utilize exome sequencing data. However, exome
data are noisy. None of the existing methods alone can achieve both high
precision and recall rate. A common practice is to perform heuristic
filtration followed by manual inspection of read depth of putative CNVs.
This approach does not scale in large studies. To address this issue, we
developed a transfer learning method, CNV-espresso, for in silico
confirming rare CNVs from exome sequencing data. CNV-espresso encodes
candidate CNVs from exome data as images and uses pretrained convolutional
neural network models to classify copy number states. We trained
CNV-espresso using an offspring-parents trio exome sequencing dataset, with
inherited CNVs as positives and CNVs with Mendelian errors as negatives. We
evaluated the performance using additional samples that have both exome and
whole-genome sequencing (WGS) data. Assuming the CNVs detected from WGS
data as a proxy of ground truth, CNV-espresso significantly improves
precision while keeping recall almost intact, especially for CNVs that span
a small number of exons. CNV-espresso can effectively replace manual
inspection of CNVs in large-scale exome sequencing studies.

Accurate in silico confirmation of rare copy number variant calls from exome sequencing data using transfer learning.

Previous PostAn efficient linear mixed model framework for meta-analytic association studies across multiple contexts.

Next PostAccurate diagnosis of atopic dermatitis by combining transcriptome and microbiota data with supervised machine learning.

About

Resources

News

Kids First Partner Institutions

Cloud Credits Inquiry

Kids First: Congenital Diaphragmatic Hernia
Kids First: Congenital Heart Defects
Kids First: Ewing Sarcoma - Genetic Risk
Kids First: Orofacial Cleft - European Ancestry
Kids First: Syndromic Cranial Dysinnervation
Kids First: Adolescent Idiopathic Scoliosis
Kids First: Disorders of Sex Development
Kids First: Orofacial Cleft - Latin American
Kids First: Neuroblastoma
Kids First: Enchondromatoses
Kids First: Familial Leukemia
Kids First: Orofacial Cleft - African and Asian Ancestry
Kids First: Novel Cancer Susceptibility in Families (from BASIC3)
Kids First: Osteosarcoma
Kids First: Craniofacial Microsomia
Kids First: Kidney and Urinary Tract Defects
Kids First: Microtia - Hispanic
Kids First: Intersections of Cancer & SBD
Kids First: Esophageal Atresia and Tracheoesophageal Fistulas
Kid First: Hemangiomas (PHACE)
Kids First: Nonsyndromic Craniosynostosis
Kids First: Myeloid Malignancies
Kids First: Leukemia & Heart Defects in Down Syndrome
Kids First: T-Cell ALL
Kids First: Cornelia de Lange Syndrome
Kids First: Bladder extrophy, Epispadias, Complex
Kids First: Laterality Birth Defects
Kids First: CHARGE Syndrome
Kids First: Orofacial Clefts - Philippines
Kids First: Fetal Alcohol Spectrum Disorders
Kids First: Intracranial Germ Cell Tumors
Kids First: Structural Defects of The Neural Tube
Kids First: Recessive Structural Brain Defects
Kids First: Chromosome 18 Structural Birth Defects
Children's Brain Tumor Network (CBTN)
Kids First: Whole genome sequencing studies of multiplex nonsyndromic cleft lip/palate families