Kids First 数据资源门户添加新数据资源
NIH 共同基金支持 加布里埃拉米勒儿童第一数据资源中心 (儿童第一刚果民主共和国) 是一项充满活力且不断发展的努力,旨在为整个研究和医疗保健领域的研究人员创造机会. 它旨在连接世界各地的研究人员进行合作和共享资源,以更好地了解遗传原因以及儿童癌症与结构性出生缺陷之间的联系.
Kids First DRC 推出了新资源, 在 Kids First 秋季网络研讨会和美国人类遗传学会年会上由 Kids First 数据支持的研究和研究 (ASHG). 目标是提高人们对科学发现的巨大潜力的认识,这种潜力对于任何职业水平的个人来说都是可以实现的, NIH 和国际研究人员之间的“儿童第一”合作伙伴关系带来了许多合作机会.
您可以阅读有关 Kids First DRC 参与的更多信息 ASHG 2022 年度会议 和 儿童第一次秋季网络研讨会 在我们的博客上.
Kids First 数据资源门户中已实施多项数据扩展和功能改进, 进一步扩大我们为世界各地儿童实现研究突破的集体能力.
Kids First 门户网站发布新数据
在九月, Kids First DRC 发布的数据 儿童首次关于科妮莉亚·德·朗格综合症的研究 (镉LS), 由首席研究员博士领导. 费城儿童医院的伊恩·克兰茨 (Ian Krantz). CdLS 是一种发育障碍,通常以身材矮小为特征, 智力残疾, 以及手臂骨骼的异常, 手, 和手指. 本研究收集的样本主要在布罗德研究所进行测序, 导致更多 7 TB全基因组序列 (全基因组测序) 可用于分析的数据. 这些 WGS 数据源自 373 研究参与者和 170 家庭, 并由对齐的读数组成, gVCF, 变体调用, 和更多. 本研究中的家庭组成包括三人组, 二人组, 和仅先证者.
近一年前, 初始数据来自 儿童首次 T 细胞急性淋巴细胞白血病研究 (T细胞ALL) 已添加到门户. 由博士领导. 费城儿童医院的 David Teachey, 该研究产生了近 68 全基因组序列数据TB. 十月份 2022, 大量新数据被添加到与本研究相关的数据集中. 数据文件数量扩大10倍以上, 添加了 Kids First Somatic Variant 工作流程的输出, 使文件总数达到 24,254. 35 RNA 序列和全外显子组序列的 TB (威信山) 也产生了. T-Cell ALL 数据集现在包含超过 259 TB 数据, 其中包括对齐的读数, 带注释和掩蔽的体细胞突变, 基因融合, 以及来自肿瘤和正常样本的变异调用.
也是在十月份, 这 Kids First 关于膀胱外翻的研究, 尿道上裂, 复杂的 (海滩), 由博士领导. 约翰·霍普金斯大学的安吉·杰林, 被释放. 样本在布罗德研究所进行测序, 导致超过 9 生成的 TB 级 WGS 数据 321 研究参与者和 134 家庭. 数据集包含对齐读取, 变体调用, 和 gVCF, 源自三重奏, 二人组, 和仅先证者的家庭分组.
新的分析工作流程加速科学发现
随着新数据资源的添加, Kids First 数据资源门户已发展到涵盖以下内容 1.7 PB 级多组学数据支持对影响世界各地儿童的状况的研究. 然而, 该图仅说明了该数据资源令人难以置信的力量的一部分. 与 Kids First 门户中的每个数据集配对的是一套分析工具和功能,可以比以往更快地实现突破性发现. 每个数据集的框架中内置了一系列工作流程 — 本质上, 预编程算法可自动分析多种研究方法 - 协助从多个角度审视疾病.
添加到 Kids First T-Cell ALL 研究的数据由 Kids First 数据专家使用体细胞变异工作流程生成, 减轻患者基因组变异检测的负担. 这套软件工具可以精确定位患者白细胞内发生变化或发生故障的基因, 与健康白细胞中发现的正常基因代码相比. 这反过来又使研究人员能够揭示患者肿瘤发展的可能根本原因。, 以及用于治疗干预的新基因靶点.
T 细胞 ALL 研究的数据也是由 RNA 测序工作流程生成的, 它允许用户查看基因组中每个基因的“表达”量. 这是研究人员可以确定导致正常细胞癌变的另一层因素. 通过这个工作流程, 研究人员可以检测基因组的特定部分是否被正确复制, 太多了, 或者在细胞分裂过程中不够, 以及遗传密码的各个部分在肿瘤发展过程中是否融合在一起.
CdLS 和 BEEC 研究的数据是使用联合基因分型工作流程生成的, 这使得研究人员能够比较三组中不同家庭的遗传变异——来自个体患者及其亲生父母的基因集合. 这将使研究人员能够识别新的变体 (任何一个 再次 或自发的), 协助追踪家族内的基因遗传.
最后, 这里强调的每项研究也利用了 Kids First Aligent 工作流程, 该功能适用于 Kids First 数据门户内的所有研究,以协助检测种系变异. 用于检查从患者血液和唾液中收集的正常细胞, 这一工作流程允许研究人员以一个连续序列检查儿童的整个基因组, 并将其与人类参考基因组进行比较以检测异常. 这, 反过来, 允许研究人员检测儿童基因组中的任何差异,这些差异可能表明疾病易感性以及新疗法的可能基因目标.
借助云计算的力量推出新发现
Kids First 数据资源中心为各个级别的研究人员提供了大量的机会, 在世界任何地方工作. 上述每个工作流程都是公开的,供研究人员在自己的数据集上使用, 允许他们将自己的基因组数据与 Kids First 数据资源中心的基因组数据结合起来. 现在, 通过 Kids First Cloud Credit 计划, 比以往任何时候都更容易获得充分利用“儿童优先”资源的能力!
Cloud Credits 计划使研究人员能够通过访问和利用 Kids First 数据资源提供的数据和工具来进行基于云的分析. 通过向个人免费提供用户积分, 该计划使更多的研究人员能够利用 Kids First 分析平台的可扩展云计算能力, 卡瓦蒂卡, 将分析时间从几个月压缩到几天. 该平台还允许研究人员导入自己的数据, 通过 Kids First 数据资源中心优化的生物信息学工作流程进行分析.
Kids First Cloud Credits 计划面向所有有兴趣使用 Kids First 数据资源的研究人员开放. 更多细节, 在这里阅读完整的公告.