首页  »  亚马逊云科技解决方案  »  医疗保健与生命科学  »  多组学数据分析最佳实践

多组学数据分析最佳实践

此亚马逊云科技解决方案有何用途 ?

该解决方案帮助用户准备基因组、临床、突变、表达和成像数据以进行大规模分析,并针对数据湖执行交互式查询,包括作为代码自动化的基础架构、用于转换数据的摄取管道,以及用于交互式分析的笔记本和仪表板。

方案优势

轻松准备和加载数据

通过 Amazon Glue 对来自癌症基因组图谱 (TCGA) 计划、癌症影像档案 (TCIA)、1000 Genomes 项目和 ClinVar 的多组数据集进行准备,方便大规模分析与查询。

可视化界面

通过 Amazon QuickSight 中的可视界面分析多模式数据;数据缓存在 SPICE(超快速、并行、内存计算引擎)数据库中,优化查询性能。

加速构建与协作

通过 Amazon SageMaker 笔记本环境提供的一键式 Jupyter 笔记本分析数据,几秒钟内立即开始工作;后台自动弹性调节资源,不会造成中断;自动捕获代码依赖项,方便协作与同步。

解决方案架构及说明

以下架构图展示了整个方案的部署架构。

  1. 通过 Amazon CLI 部署 Hail 模型到 Amazon EMR
  2.  利用 Amazon SageMaker Notebook 提交测试代码
  3. 利用 Amazon S3 整合不同组学数据
  4. Hail 模型与 Amazon SageMaker 联合分析