亚马逊云科技发布新功能 云数据仓库查询实现10倍速

AQUA(高级查询加速器)将计算引入存储层,使Amazon Redshift查询的运行速度比其他云数据仓库最高快10

福克斯公司、亚马逊广告和Sisense等客户已开始使用AQUA for Amazon Redshift

近日,亚马逊云科技宣布AQUA for Amazon Redshift全面可用。作为一种创新的新型分布式硬件加速缓存,AQUA可以使Amazon Redshift查询的运行速度比任何其他云数据仓库最高快10倍。AQUA将计算引入存储层,消除了数据在不同存储位置和计算集群之间不必要的移动,帮助客户避免网络带宽限制。AQUA让客户有了显示更加实时的仪表盘,节省了开发时间,并且让其系统更容易维护。目前Redshift RA3实例已带有AQUA,客户无需支付额外成本,即可在不修改任何代码的情况下享受AQUA带来的性能提升。欲开始使用AQUA,请访问:https://aws.amazon.com/redshift/features/aqua

Amazon Redshift是第一款基于云的数据仓库,成本只有传统数据仓库的十分之一。自2012年推出以来,Amazon Redshift已经成为最受欢迎的云数据仓库。此前,亚马逊云科技发布Amazon Redshift RA3实例,客户可以分别扩展计算和存储,与任何其他云数据仓库相比,提供最高达3倍的性价比。然而,即使数据仓库的性能持续提高,客户需要处理的数据快速增长依然会导致平衡性能和成本效率的两难境地。数据仓库的主流方法是将大量集中存储移至计算节点上进行数据处理。这种方法的挑战在于共享数据和计算节点之间存在大量的数据移动。随着数据量持续快速增长,这种数据移动会使可用的网络带宽饱和,降低性能。除了网络瓶颈之外,CPU无法跟上快速增长的存储性能(SSD存储吞吐量的增长速度比CPU从内存处理数据的能力快6),这要么导致新的CPU瓶颈,这迫使更多客户为了更快地完成工作而超额部署计算资源。

AQUA for Amazon RedshiftAmazon Redshift的分布式硬件加速缓存,这是一项针对提高大规模数据分析性能的创新。AQUA将计算引入存储层,因此数据不必在两者之间来回移动。这使得Amazon Redshift的运行速度比任何其他云数据仓库最高快10倍。AQUA缓存可横向扩展,并可跨众多节点并行处理数据。每个节点都包含一个由亚马逊云科技设计的分析处理器组成的硬件模块,可以极大地加速数据压缩、加密和数据处理任务(如扫描、聚合和过滤)AQUA还为客户提供了额外的好处,即可以在原始存储上进行计算,从而节省了移动数据的时间。有了这个新的架构,以及其带来的数量级的性能提升,Redshift户可以实现更加实时的仪表盘,节省了开发时间,其系统也更容易维护。

现有的集中式存储数据仓库架构需要将数据转移到计算集群中处理,这造成了瓶颈并降低了性能。亚马逊云科技分析副总裁Rahul Pathak表示,通过将计算引入存储层,AQUA帮助客户消除不必要的数据移动,避免了网络带宽的限制,带来了比其他任何云数据仓库高一个数量级的性能表现,Amazon Redshift用户无需支付额外成本即可享用这一改变游戏规则的性能飞跃。

目前,在美国东部(弗吉尼亚北部)区域、美国西部(俄勒冈)区域、美国东部(俄亥俄)区域、亚太地区(东京)区域和欧洲(爱尔兰)区域运行Amazon Redshift RA3 节点的客户已经可以使用AQUA for Amazon Redshift ,其它区域也将很快推出。

福克斯公司通过包括福克斯新闻、福克斯体育、福克斯网络和福克斯电视台在内的一些世界领先和最具价值的品牌,制作和分销内容。福克斯让各种各样的创作者能够想象和创作具有文化意义的内容,同时建立一个集创意、运营专业知识和战略思维于一体的组织。福克斯公司的使命就是让数百万观众享受屏幕带来的简单乐趣。我们为全球观众提供新闻、体育和娱乐等新鲜资讯,而数据是我们所做一切事情的核心。福克斯公司数据服务副总裁Alex Tverdohleb表示,“Amazon Redshift使我们可以跨数据仓库、运营数据库和Amazon S3数据湖分析我们PB级的结构化和半结构化数据,从而发现、分析和激活数据驱动的决策,获得强有力的洞察。随着PB级数据的持续快速增长,我们一直在测试AQUA for Amazon Redshift的性能,在保持成本不变的同时,为分析查询提供更强的性能。AQUA for Amazon Redshift将我们的一些分析查询性能提高了一个数量级,让我们通过使用最新技术,向观众提供更个性化、精心设计和及时体验。

亚马逊广告帮助各种规模的企业和品牌增长,通过提供合适的广告解决方案,帮助企业提高品牌知名度及产品、品牌或服务认知度,推动购买,或增强客户忠诚度。我们使用Amazon RedshiftLake House(智能湖仓)架构(能够在数据仓库、运营数据库和数据湖中查询数据)来管理数百PB的数据,每天为成千上万的客户服务。亚马逊广告高级经理Shamik Ganguly表示,我们最近开始使用AQUA for Amazon Redshift,它改变了游戏规则。我们发现,一些最复杂的分析查询,涉及扫描大型数据集的归因、个性化、品牌洞察和聚合等,通过AQUA能将性能提高10倍。对于一些要求极高的查询,AQUA极大地减少平均等待时间,让我们能够在系统上多运行50%的查询,同时保持成本不变,从而更快地实现价值,为客户提供更好的体验。

Sisense的使命是帮助企业在任何地方都可注入分析技术,让企业的客户和员工在任何时候都能对他们的数据采取及时行动。数千家企业和全球品牌依靠我们人工智能驱动的分析平台创新、颠覆市场,并推动世界发生有意义的变化。” Sisense首席战略官Guy Levy-Yurista博士表示,我们使用Amazon Redshift,让我们的客户能够快速和轻松地将复杂的数据转换为高度交互的、可操作的应用程序,可以嵌入和大规模交付。我们正在使用AQUA for Amazon Redshift,很高兴地看到,扫描、过滤和聚合大型数据集的复杂分析查询运行速度比以前快了810倍。AQUA for Amazon Redshift为我们提供了快速分析PB级数据所需的性能和可伸缩性,并提供及时的见解,使每个用户和每个团队受益。