为什么选择基于云的分析?
基因组规模分析所需的高性能计算需要先进的计算机基础设施. 通过将一组服务器和存储设备联网, 研究人员可以利用这些机器进行基因组比对和变异调用所需的大规模计算和计算. 高性能计算会产生与购买设备相关的大量前期成本,以及与维持环境和电力以保持一切运行的人员相关的持续成本.
基于云的计算允许访问相同的基础设施,而无需拥有和管理机器本身. 而不是自己购买电脑, 云计算用户根据其使用情况支付在该环境中工作的费用. 分析开始时可以快速启动数十台机器 – 一旦工作完成并且不再需要它们,就尽快关闭. CAVATICA 提供在用户请求时激活和停用这些计算机的服务. 这使得研究人员能够专注于他们项目的生物学和生物信息学方面, 例如实验设计和分析, 无需从头开始建立云基础设施.
数据分析要求基因组文件与处理它们的软件工具位于同一位置. 基因组数据规模和大小的不断增加正在成为将这些文件移动到安装软件的机构位置的负担. 基于云的分析提供了另一种选择——将相对较小的软件文件移动到存储数据的位置.
此外, 云计算还允许用户与协作者无缝共享数据. 任何协作者都可以创建帐户并获得对同一平台的访问权限. 有用的数据产品, 工具, 结果发表后还可以快速传播并与更广泛的研究界共享.
全面的, 云平台代表了用户下载数据集并在本地进行分析的可持续替代方案. 了解更多信息, 这 2018 NIH 数据科学战略计划 强调云计算可以通过简化数据使用在未来的研究中发挥强大且具有成本效益的作用, 允许快速访问, 并最大限度地减少基础设施和维护成本.
开始使用 CAVATICA
有关使用 CAVATICA 的信息, 请拜访 CAVATICA 知识中心. 以下页面是帮助入门的有用地方.