阿尔茨海默氏病研究门户网站支持大规模数据共享和科学发现

根据世界卫生组织(WHO)的数据, 全球有 超过5500万人患有痴呆症 ,其中最常见的痴呆症是阿尔茨海默氏病,约占60-70%。据估计 , 每年的财务影响 为1.3万亿美元。确定阿尔茨海默氏病的病因并制定该病的诊断方法和潜在的治疗方法需要多模态、多组学分析。这可以通过公私合作伙伴关系来实现,这些伙伴关系使人们能够访问大型遗传、基因组和神经影像学数据集以及大数据处理、信息学和算法开发方面的专业知识。

使用 亚马逊云科技 统一阿尔茨海默病研究的基因组学数据

李三旺博士、宾夕法尼亚大学佩雷尔曼医学院病理学和实验室医学系副系主任、彼得·诺威尔博士是宾夕法尼亚大学神经变性基因组学中心(PNGC)的联合主任,并领导多个由美国国立卫生研究院(NIH)资助的阿尔茨海默氏病遗传学项目。

2011年,PNGC主任杰拉德·谢伦伯格博士会见了王博士及其研究团队,开始探索用于大规模基因组计算的云技术。他们开始使用亚马逊网络服务 (亚马逊云科技) 来构建一个包含 36 个外显子体(即 1.1 太字节 (TB))的小规模概念验证。从那时起,他们的工作已发展成为阿尔茨海默氏病和相关疾病最大的基因组数据数据库之一:由亚马逊云科技提供支持的国家阿尔茨海默氏病老化遗传学研究所数据存储网站(NIAG ADS DSS )。

Pictured: Li San Wang, PhD, the Peter C. Nowell, M.D. Professor and Vice Chair for Research in the Department of Pathology and Laboratory Medicine at the University of Pennsylvania’s Perelman School of Medicine.

图为:李三旺博士,宾夕法尼亚大学佩雷尔曼医学院病理学和实验室医学系医学博士教授兼研究副系主任 Peter C. Nowell。

亚马逊云科技 上的 NIAGADS 基因组数据库是一种可搜索的注释资源,可访问阿尔茨海默氏病和相关神经病理学的公开数据集。NIAGADS旨在使研究人员更容易获得阿尔茨海默氏症遗传学知识,它拥有来自98个数据集的172,701个样本的基因组学数据,现在的总大小为1.3千兆字节(PB)。数据类型包括全基因组/外显子组测序;全基因组关联研究 (GWAS) 和插补;rnaSeq;单神经元全基因组测序 (WGS);蛋白质组学;和代谢组学。该数据库的界面旨在指导不熟悉遗传数据的用户不仅可以探索,还可以解释不断增长的数据量。

研究人员可以通过交互式搜索和NIAG ADS基因组浏览器识别和解释从统一数据集汇编而成的感兴趣的基因组 区域。 这些数据连同变异和基因注释及其功能意义基于公共或阿尔茨海默氏病相关的实验数据源进行整理

支持数据共享以加速阿尔茨海默氏病研究

NIAGADS正在创建一个通过与大量机构共享数据来促进科学发现的系统。 N IAGADS数据共享服务促进了阿尔茨海默氏病测序项目( ADSP)和其他由国家老龄研究所(NIA) 资助的痴呆基因组研究的基因组数据的沉积 和共享与更广泛社区的批准研究人员。识别增加阿尔茨海默氏病风险或预防阿尔茨海默氏病风险的遗传变异需要对许多个体的基因组进行测序和分析,而这仅凭来自单一机构的数据是不可能的。

迄今为止,已经发现了90多个与阿尔茨海默氏病风险相关的全基因组重要位点(位点)( Kunkle AD GWAS NG2019 、 Bellenguez AD G WAS NG2022 、Bis Mol Psychiatry和Holstege WES 202 2)。 NIAGADS中的数据代表了该领域的一些重大进展和发现。与其他相关临床结果(例如发病年龄和脑脊液生物标志物水平)的关联已导致数百个基因座和相关性的发现,有可能帮助研究人员更好地了解痴呆的生物学,检验新的假设并制定新的治疗策略。NIAGADS的阿尔茨海默氏病变异门户(A DVP )收集了此类遗传学发现,其中包含基因和变异的出版物和注释链接。

由于来自学术界、业界和联邦政府的许多人的远见卓识和辛勤工作,主要研究人员 可以使用他们的eRa Commons ID 登录 ,通过数据访问请求管理系统请求可用数据 。每个数据访问请求都由NIAGADS数据访问委员会审查。

支持 NIAGADS DSS 的 亚马逊云科技 基础设施

NIAGADS 使用 亚马逊云科技 传输、处理、存储和归档基因组学数据,并监控数据访问模式。在数据共享基础设施方面,NIAGADS使用亚马逊简单存储服务(Amaz on S3 )、 亚马逊S3 Glacier Deep Archiv e 、亚马逊弹性计算云(Am azon EC2 )、亚马逊 弹性文件系统(Amazon E FS )、 亚马逊 弹性区块存储(Ama zon EB S )和 亚马逊云科技 Transfer Family。 为了安全和合规,该团队利用了 亚马逊云科技 CloudTrail、Amazon Guard Duty、 AW S Config 、A WS S ecurity Hub 和亚马逊 Cloud Watch 等服务。

使数据集多样化以及 NIAGADS 的更多后续步骤

世卫组织报告说,在被诊断为痴呆症的人中,有60%以上生活在低收入和中等收入国家,扩大包括国际合作者在内的研究人员库是该计划的关键目标。NIAGADS 很高兴能继续在 亚马逊云科技 的基础上再接再厉,进一步扩大其全球影响力、支持所有类型阿尔茨海默病数据的协作分析能力以及数据共享生态系统。

需要一个村庄来帮助确定保护性基因变异以及治疗和预防途径。鼓励来自合格机构的研究人员 访问NIAGADS网站 , 并与NIAGADS团队合作贡献和分析数据。

在 亚马逊云科技 上阅读有关开放科学模型的更多信息:

  • 全球研究人员现在可以免费获得最大的转移癌症数据集
  • 为高度分布的数据集创建访问控制机制
  • 儿科癌症研究人员使用 亚马逊云科技 加速 “癌症登月”
  • 研究人员如何通过 亚马逊云科技 满足联邦政府资助研究的新开放数据政策
  • 利用 亚马逊云科技 云加速研究并使其民主化
  • 介绍 10 分钟云端研究教程

订阅 亚马逊云科技 公共部门博客时事通讯 将来自公共部门的 亚马逊云科技 工具、解决方案和创新的最新信息发送到您的收件箱,或者 联系我们

请花几分钟时间在本次调查中分享您对 亚马逊云科技 公共部门博客的体验的见解 ,我们将使用调查的反馈来创建更多符合读者偏好的内容。