跳至主要内容
搜索

门户数据字典

数据探索过滤器

学习

研究名称 完整的研究名称. 这与发布数据文件的 dbGaP 研究的名称相匹配.
学习代码 分配给每项研究的短代码,用于在 Kids First Portal 上进行搜索和标记.
学习计划 支持研究中样本测序的资助计划.
研究领域 作为研究重点的广泛的条件类别
dbGaP 登录号 dbGaP 为每个研究分配的 ID. 它们的格式为 phs00xxxx,用于识别受控访问数据的 dbGaP 应用感兴趣的研究.

参加者

先证者 作为注册学习起点的参与者, 通常是第一个寻求医疗救助的家庭成员.
种族 个人自我描述的社会和文化群体, 具体来说,一个人是否将自己描述为西班牙裔或拉丁裔. 该值是自我报告的,可能来自表格, 问卷调查, 面试, ETC.
性别 指定个体参与者的生物性别. 该值是自我报告的,可能来自表格, 问卷调查, 面试, ETC.
种族 共同历史的表征, 国籍, 或地理分布. 该值是自我报告的,可能来自表格, 问卷调查, 面试, ETC.

临床

诊断年龄 (天) 参与者被诊断患有该疾病的年龄(以天为单位).
生命状态年龄 (天) 参与者最近已知的生命状况的最近时间的年龄(以天为单位)
观察表型时的年龄 (天) 观察到表型的参与者的年龄(以天为单位).
诊断 (世界) 与诊断相关的 MONDO ID (源文本) 价值. 通过匹配诊断得出 (源文本) MONDO ID 查找的值.
诊断 (NCIT) 美国国家癌症研究所同义词库 (NCIT) 与诊断值关联的 ID. 通过将诊断源文本值与 NCIT 查找相匹配而得出.
诊断 (源文本) 分析, 以及对疾病的存在和性质的认识, 状况, 或因明显的体征和症状而受伤; 还, 任何形式的科学测定; 此类研究/调查的简明结果. 源文本值未统一并以直接从原始研究者处获取的方式呈现.
家庭构成 根据参与者谱系中提供基因组数据的家庭成员计算出的值.
观察到的表型 (羟基磷灰石) 与观察到的表型相关的人类表型本体 ID (源文本) 价值. 通过匹配观察到的表型得出 (源文本) HPO ID 查找的值.
未观察到的表型 (羟基磷灰石) 与负面观察到的表型相关的人类表型本体 ID, 这是由临床医生专门检查并观察到参与者不存在的.
观察到的表型 (源文本) 参与者因基因表达而产生的可观察特征, 环境因素, 以及他们的互动. 源文本值未统一并以直接从原始研究者处获取的方式呈现.
生命状况 参与者的生存状态.

生物样本

样品类型 代表分子样本分析物种类的文本术语
采集样本类型 代表样本细胞组成的文本术语
生物样本采集年龄 (天) 收集生物样本之日参与者的年龄(以天为单位)
组织学诊断年龄 (天) 参与者的年龄(以生物样本被分配组织学之日的天数为单位)
样品供应情况 是否可根据研究小组的要求提供生物样本
解剖部位 (NCIT) 美国国家癌症研究所同义词库 (NCIT) 与解剖部位值关联的 ID. 通过匹配解剖部位得出 (源文本) NCIT 查找的价值.
解剖部位 (源文本) 采集生物样本的参与者身上或体内的位置. 源文本值未统一并以直接从原始研究者处获取的方式呈现.
同意类型 与该研究参与者同意允许对给定生物样本进行的研究类型相对应的代码. 有关这些代码的完整说明, 查看该研究的 dbGaP 页面.
dbGaP 同意代码 将生物样本的 dbGaP 登录号与其同意类型相结合的代码. 该研究的 dbGaP 页面上提供了每个代码的映射值.
组织学诊断 (世界) 与组织学诊断相关的 MONDO ID (源文本) 价值. 通过匹配组织学诊断得出 (源文本) NCIT 查找的价值.
组织学诊断 (NCIT) 美国国家癌症研究所同义词库 (NCIT) 与组织学诊断相关的 ID (源文本) 价值. 通过匹配组织学诊断得出 (源文本) NCIT 查找的价值.
组织学诊断 (源文本) 描述给定生物样本生长模式的特定类型的恶性肿瘤, 通常由病理学家指定. 源文本值未统一并以直接从原始研究者处获取的方式呈现.
肿瘤位置 (源文本) 参与者身上或体内肿瘤所在的位置,该生物样本源自该肿瘤. 源文本值未统一并以直接从原始研究者处获取的方式呈现.
样品采购方式 用于从参与者收集生物样本的临床或实验室程序
肿瘤描述符 (源文本) 恶性肿瘤是原发性肿瘤还是复发性肿瘤

数据文件

使用权 下载文件所需的授权类型. 开放访问文件可供任何注册门户用户使用. 受控访问文件需要批准 & 由 dbGaP 或控制 DAC 授权.
数据类别 数据文件作为其一部分生成的实验类型的最广泛的描述符. 可能的值包括基因组学, 转录组学, 蛋白质组学, ETC.
数据类型 数据文件中包含的数据类型. 可能的值包括对齐的读数, 变异调用, ETC.
实验策略 数据文件作为其中一部分生成的实验类型的更具体的描述符. 可能的值包括全基因组测序, 全外显子组测序, 链接读取全基因组测序, ETC.
文件格式 文件的技术规格, 通常是文件的文件扩展名.
平台 用于生成测序数据的测序平台名称.
仪器型号 用于生成测序数据的测序仪模型.
图书馆斯特朗 用于生成数据文件的测序文库是否搁浅.
是配对结束 用于生成数据文件的测序文库是否双端.
存储库 授权和验证对数据文件的访问的实体.
前交叉韧带 根据数据访问委员会分配给文件的访问控制列表值 (数模转换器) 授权. 这是从基于 NIH 的数据集的 dbGaP 获得的.
关闭菜单