发布于: Feb 2, 2023

Amazon OpenSearch Serverless 的上线,让亚马逊云科技成为首个 Analytics All on Serverless 的云供应商,未来的云原生数据分析将会更敏捷,更易用!亚马逊云科技 re:Invent 2022 上,Adam Selipsky 宣布了 Amazon OpenSearch Serverless (Preview) 预览版。今天,我们很高兴地宣布 Amazon OpenSearch Serverless 已上线,当用户搜索和分析 PB 级的数据时,运行工作负载将会更容易更简单,甚至不需要考虑基础设施管理!

多年来,我们目睹了各种技术的兴起和普及。

作为云计算的“新常态”,Serverless 已经不再是一个未来概念,它提供了进一步的 IT 基础设施抽象,使 IT 基础设施资源在需要时动态可用,进而有效地降低管理成本与维护成本。对于开发人员来说,更多的好处与开发速度有关,Serverless 的云原生服务让工程师能以现代化的方法构建软件,只需要关注业务逻辑,一个小团队就有可能完成所有事情。这也为企业减少了前期投资,可以专注于推动差异化的业务价值,加快生产时间,这些也影响着企业的运作方式,从而能够产生多米诺骨牌效应,在市场竞争中不断获利。 在过去的几年中,亚马逊云科技不断发布 Serverless 相关的新服务选项,从数据库、数据分析、人工智能等多个服务领域全面推进 Serverless 进程。

应用程序中的数据可能会来自不同的地方,有着不同的类型,像点击流、IoT、图片、音视频等各种半结构化、非结构化的数据都在源源不断地产生。我们需要正确的分析工具来分析不同类型的数据,帮助我们了解今天正在发生的事情,再通过机器学习预测未来会发生什么,并将智能构建到系统和应用程序中。

亚马逊云科技的其他无服务器分析产品包括用于商业智能的 Amazon QuickSight 和用于数据集成的 Amazon Glue

用户可以从亚马逊云科技专门构建的各种分析服务中进行选择,以从数据中获取最大价值,包括用于处理大量非结构化数据的 Amazon EMR (使用 Apache Spark 和 Hive 等开源大数据框架)、Amazon MSK 用于摄取实时数据流,以及云原生数据仓库 Amazon Redshift

Amazon OpenSearch Serverless 的上线,填补了亚马逊云科技数据分析产品组合的 Serverless 选项的最后空白,现在亚马逊云科技提供的所有的数据分析服务已全部实现了 Serverless 无服务器化。

Amazon OpenSearch Service 可让您轻松执行交互式日志分析、实时应用程序监控、网站搜索等工作。OpenSearch 是一款开源的分布式搜索和分析套件,衍生自 Elasticsearch。Amazon OpenSearch Service 是 Amazon Elasticsearch Service 的后继者,提供最新版本的 OpenSearch,支持19个版本的 Elasticsearch (1.5到7.10版本),并支持由 OpenSearch Dashboards 和 Kibana (1.5到7.10版本) 提供的可视化功能。Amazon OpenSearch Service 目前已经拥有上万个活跃客户,托管了数十万个集群,每月处理数百万亿个请求。

托管集群模式和 Serverless 模式都是 Amazon OpenSearch 服务的部署选项,并由开源的 OpenSearch 项目提供支持。Amazon OpenSearch Serverless 使得集群更轻松地应对周期性、间歇性或不可预测的工作负载,而无需考虑调整大小、监视和调整 OpenSearch 集群。

Amazon OpenSearch Serverless 解耦了存储和计算,这允许每个层根据工作负载需求独立扩展。这种解耦还允许隔离索引和查询计算节点,这样车队就可以并发地运行,而没有任何资源争用。计算资源,如 CPU、磁盘利用率、内存和热分片状态,都由服务监视和管理。当达到这些系统阈值时,服务会调整容量,因此您不必担心扩展资源。

使用 OpenSearch Serverless,您不必预置或调整资源,也不必为生产环境中的峰值负载提前过度规划资源。您只需支付工作负载实际所消耗的计算和存储资源。

大多数支持 OpenSearch 的工具也支持 Amazon OpenSearch Serverless。您不必重写现有的 Pipeline 和应用程序。无服务器选项与开源 OpenSearch 有着相同的逻辑数据模型和查询引擎,因此您可以使用相同的输入查询 API,以及使用 Dashboard 仪表板进行交互式数据分析和可视化。

越来越多的数据服务,客户要求其易用性,要求不去管理底层的基础设施,越来越走向无服务化。

从单一数据分析能力走向全栈的数据分析能力。如之前数据分析服务只具备某些数据分析环节的能力,比如即时分析、ETL。到现在 Serverless 涵盖从数据的摄取、存储、大数据分析、数仓等,可以看到,Serverless 已经演进到具备一个全栈数据分析的能力。

从应用人员来讲,我们之前面对的数据分析的用户更多是 Builder 的角色(即要在数据分析之上构建自身的上层应用),到现在有越来越多的 Buyer 角色(更多的是业务团队),Serverless 提供了良好的开箱即用的能力,像数据分析师、数据科学家等用户直接基于 Serverless 的数据分析产品,可以快速开展工作,如交互式查询、数据探索等。

这张图可以看出,在亚马逊云科技上具有广泛的 serverless 服务, 涵盖了存储、数据库、流处理、NoSQL、大数据处理、数仓、BI 等服务。

服务层的全面无服务器化,仅仅只是云计算赋能应用创新的开始,人们需要了解并尝试使用这种云上数据分析“新常态”。

最初的大多数工作都花在了定义和构建正确的服务体系结构上,以有效地支持不断增长的性能和规模需求上。Amazon OpenSearch Serverless 分离存储和计算组件、索引和查询计算,因此它们可以独立地管理和缩放。Amazon OpenSearch Serverless 使用 Amazon S3 作为索引的主要数据存储,因此您不需要担心数据持久性。我们已经将您的配置选择与适当的资源配置方式分离,因此配置错误不会导致中断。这种灵活的、基于微服务的体系结构将使我们能够继续定期推出新功能,提高规模和性能的标准,并进一步降低成本,例如,在没有任务活动时,回收所有计算节点以节省整体使用成本。

此次发布 Amazon OpenSearch Serverless 对于索引和查询的支持,在每个帐户的最大 OCU (OpenSearch Compute Units) 限制已经从20增加到50。您现在可以使用各类 OpenSearch 客户端来获取和查询您的数据,并使用 Logstash 从 OpenSearch 预置集群中迁移数据到 Serverless 集群。此外,我们还增加了对另外三个区域的支持。

Amazon OpenSearch Serverless 目前在全球八个地区提供:美国东部(俄亥俄)、美国东部(弗吉尼亚)、美国西部(俄勒冈)、亚太(新加坡)、亚太(悉尼)、亚太(东京)、欧洲(法兰克福)和欧洲(爱尔兰)。