发布于: May 21, 2021

数据库云平台为弥补传统数据库的不足而生。今天,数据的重要性已经渗透到各个领域,成为每个行业发展和变革的必要元素。然而,我们依然需要数据库来帮助我们存储和组织这些数据。传统的数据库技术并没有因为互联网技术的发展而消失,但是在互联网时代,对于数据库的新需求却不断出现。数据的规模不断增长,企业的需要处理的数据规模从GB 快速增长到 TB 甚至 PB 规模,同时需要提供毫秒级延迟的数据访问,数据库有时需要每秒处理数百万个请求,可扩展以支持世界各地的数以百万,千万计的用户。随着这些新的需求越来越广泛地被提出,越来越多的企业意识到,采用传统的数据库应对不同需求这种一刀切的方式,已经不再奏效。

开发人员面对特定的需求场景,往往需要选择一款适合他们需求的数据库。很多企业开始尝试采用不同类型的开源数据库,如 MySQL,PostgreSQL 等,然而,如果希望通过采用开源数据库满足不同类型的需求,又同时获得与商业级数据库相同的性能和可用性却非常的困难。为了响应这一客户需求,Amazon Web Services 提供了一系列针对特定场景进行优化的数据库,如下图所示:

图1:Amazon Web Services 数据库服务一览图

1.关系型数据库:作为被广泛采用的数据库类型,关系型数据库在很多场景下,比如企业的 ERP,CRM,财务系统和交易系统等,具有独特的优势。这些场景下,客户通常会有对于数据有强一致性的需求,要求数据库支持事务性处理(Transactional Processing)。基于客户这一需求,Amazon Web Services 为此构建了Amazon Aurora 数据库。Amazon Aurora 是一个针对云构建的与 MySQL 和 PostgreSQL 兼容的关系型数据库,它结合了高端商业数据库的性能和可用性,以及开源数据库的简单性和成本效益。

包含国内很多知名企业在内的成千上万的客户在 Aurora 上运行他们的应用程序,比如大家所熟知的 Camel Games, 虎牙直播,九州通医药,以及国际上知名的 NASDAQ,Dow Jones 等,都选择了在 Amazon Aurora 上运行他们的关键业务负载,获得了性能提升。

虽然 Amazon Aurora 数据库是关系型数据库在云上的首选,但是 Amazon Web Services 也支持客户首先把原有的数据库直接迁移到云上来,即刻享受到云上数据库服务带来的便利性,高可用和成本的节约。为此,Amazon Relational Database Service (Amazon RDS)提供了多种关系型数据库的引擎便于选择,包括 PostgreSQL, MySQL, MariaDB, Oracle, and SQL Server 等。您可以使用 Amazon Web Services Database Migration Service 轻松将您现有的数据库迁移或复制到 Amazon RDS。

2.键-值型数据库:在移动互联网,电商,游戏以及物联网等很多新型场景中,数据库需要面对超大规模的数据处理,同时又需要低延迟的性能保障。对于这些需要极高的吞吐量和并发性、低延迟以及可靠性的需求,我们提供了 Amazon DynamoDB。这是一款适用于任何规模的快速灵活的 NoSQL 数据库服务。

许多全球发展最快的企业,如 Lyft,三星等企业,都依靠 Amazon DynamoDB 的规模和性能来支持其关键任务工作负载。在国内,我们也看到诸如虎牙直播, Mobvista(汇量科技)等客户利用 Amazon DynamoDB 去应对其相应场景的需求。以 Lyft 为例,它的共享单车服务每天都需要处理海量的 GPS 数据来实现对车辆的追踪,这些数据结构往往很简单,存储量规模都非常大,但又往往需要在极短的时间内允许用户从不同的地方查询和访问。通过采用 Amazon DynamoDB 这种键-值型数据库就满足了上述的需求。

3.文档型数据库:很多客户将 MongoDB 用作文档数据库,用于存储、检索和管理半结构化数据。由于设置和管理 MongoDB 集群所带来的复杂性,在 MongoDB 上构建可以快速扩展到多兆字节(TB)和每秒数十万次读写的高性能、高可用性的应用程序极具挑战性。为此,Amazon Web Services 提供了Amazon DocumentDB(兼容 MongoDB),它是一项快速、可扩展、高度可用且完全托管的文档数据库服务,支持 MongoDB 工作负载。作为一个文档数据库,Amazon DocumentDB 使得存储、查询和索引 JSON 数据变得简单。

4.图数据库:在社交网络、推荐引擎和欺诈检测等使用案例中,开发人员需要在数据之间创建关系并快速查询这些关系。这个时候,如果采用关系型数据库,就需要面临及其复杂的 SQL 嵌套查询和联接去实现,随着数据的增加,性能也变得不能满足需求。Amazon Neptune 是一项快速、可靠且完全托管的图形数据库服务,可帮助客户轻松构建和运行使用高度互连数据集的应用程序。

5.时序数据库:随着物联网技术的发展,大量的 IoT 设备兴起,时间序列数据是增长最快的数据类型之一。时间序列数据具有特定的特征,例如通常以时间顺序形式出现,数据只能附加,并且查询总是在一个时间间隔内进行。Amazon Timestream(注册预览版)是一种专门构建的时间序列数据库,它可以按时间间隔高效地存储和处理这些数据。利用 Timestream,您可以轻松存储和分析用于开发运营的日志数据、用于 IoT 应用程序的传感器数据和用于设备维护的工业遥测数据。

6.内存数据库:在游戏,视频流服务,社交网络等新型场景中,客户往往需要应用能够实时访问和查询海量数据。Amazon ElasticCache 就是一款支持实时应用程序,提供亚毫秒级延迟的数据库。比如知名的地图软件公司 Here,每天需要处理高达 4 亿次的 API 请求,来实现将客户的定位数据转变成地理位置数据,通过采用 Amazon ElasticCache,极大的降低了访问的延迟时间,提高了客户的满意度,同时,还通过将负载从 CPU 优化的实例迁移到低成本的 Cache 节点来实现了成本的降低。

7.分类账数据库:很多公司需要记录在与客户的经济和金融活动的历史记录,比如银行交易中的信贷和借记历史,保险索赔的数据沿袭,供应链网络中的项目移动等。关系型数据库难以跟踪和验证对数据的任何意外更改。区块链框架会增加设计的复杂性,客户需要建立一个包含多个节点的完整区块链网络。Amazon QLDB 是一种新型数据库,提供了一个透明、不可变、可以以加密方式验证的事务日志,且该事务日志由一家可信的中央机构拥有,用于跟踪每次的应用程序数据更改,并不断维护完整且可验证的更改历史记录。

相关文章