数据:现代发明的起源

只需要 一项开创性的发明 (一项解决客户普遍痛点的标志性创意)即可永久创建或转变一个行业。从 电报的 发明 全球定位系统的 发现 ,再到 最早的 云计算服务 ,历史上充斥着这些 “尤里卡” 时刻的例子,这些时刻继续对我们当今的业务方式产生长期影响。

认知科学家 John Kounios 和 Mark Beeman 证明,伟大的发明家不只是偶然发现自己的顿悟;实际上,一个想法之前会有一系列生活经历、教育知识,甚至是人脑随着时间的推移而处理和吸收的失败。在他们的想法之前,先收集了一系列 数据点。

当我们将这一概念应用于组织以及每天产生的大量数据时,我们意识到采集、存储、处理、分析和可视化数据以创建下一件大事是难得的机会。

今天,数据比以往任何时候都更是现代发明的起源。 但是,要利用我们的数据产生新想法,我们需要建立动态的 端到端数据策略 ,将新的客户体验作为最终产出。世界上一些最大的品牌,例如 一级方程式 丰田 佐治亚太平洋 公司,已经 在利用亚马逊云科技来做到这一点。

本周在 亚马逊云科技 re: Invent 2022 上 ,我分享了我们在与这些品牌以及使用 亚马逊云科技 制定数据策略的 150 多万客户 合作后收集 的几项重要经验。

我还向我们的客户透露了几项新的服务和创新。以下是一些亮点。

您需要一套全面的服务才能完成工作

创建用于执行分析和机器学习 (ML) 的数据湖 不是端到端的数据策略。 随着 时间的推移 ,您的需求将不可避免地 增长和变化 ,这就是为什么我们认为每个客户都应该能够根据数据类型、角色 及其特定用例 访问各种工具的原因。

我们的数据支持这一点, 前 1,000 名 亚马逊云科技 客户中, 有 94% 使用我们的 10 多个数据库和分析服务。 从长远来看,一刀切的方法根本行不通。

您需要一套全面的服务,使您能够 在 数据库 数据 湖 和 数据 仓库中 存储和查询 数据 ;需要 通过 分析 商业智能 机器学习 帮助您 对数据 采取行动的 服务 ;以及帮助 您在组织内对 数据 进行 编目和管理 的服务 。

无论您使用的是 财务 数据、 临床数据还是 零售 数据,您还应该能够访问支持未来用例的各种数据 类型的服务 。 我们的许多客户也在使用他们的数据来创建 机器学习模型 ,但是有些数据类型仍然过于繁琐,无法处理和为机器学习做准备。

例如,支持 自动驾驶汽车 城市规划 甚至 农场 作物产量 等用例的地理空间数据对于机器学习的访问 、准备和可视化可能非常困难。因此,本周我们宣布了 Amazon S ageMaker的新功能,这些功能使数据科学家可以更轻松地处理地理空间数据。

性能和安全性至关重要

性能和安全性仍然是我们客户数据战略的关键组成部分。

当你想要快速分析和可视化 数据时 ,你需要在 数据仓库 数据库 和数据湖 中大规模执行任务。我们的业务建立在 亚马逊Aurora 、Amazon DynamoD B和 A ma z on Redshif t等高性能服务的基础上,本周我们宣布了几项新功能,以继续在迄今为止的性能创新基础上再接再厉。

对于我们的无服务器交互式查询服务 Amazon A thena,我们宣布了 与 Apache Spark 的全新集成,使您启动 Spark 工作负载的 速度比其他无服务器 Spark 产品快 75 倍 。我们还在完全托管的文档数据库 Amazon DocumentDB 中引入了一项名为 “ 弹性集群 ” 的新功能,该功能使客户能够轻松地在多个数据库实例之间横向扩展或分片数据。

为了帮助客户保护其数据免遭潜在的泄露,我们宣布推出了 Amazon GuardDuty RD S 保护,以智能检测存储在 Aurora 中的数据的潜在威胁,并 推出 一个新的 开源项目,允许开发人员在其核心数据库中安全地使用 PostgreSQL 扩展,而不必担心意想不到的安全影响。

连接数据对于获得更深入的见解至关重要

为了充分利用数据,您需要组合数据孤岛以获得更深入的见解。但是,跨孤岛连接数据通常需要复杂的提取、转换和加载 (ETL) 管道,这意味着每当你想问不同的数据问题或构建不同的 ML 模型时,都需要手动集成。这还不够快,无法跟上当今企业所需的发展速度。

零 ETL 是未来。 几年来,通过 深化服务之间的集成 ,我们在零ETL的未来中取得了长足的进步。 但是本周,我们宣布Auror a现在支持与Amazon Redshift进行零ETL集成,将交易数据整合到Aurora中,将分析功能整合 到Amazon Redshif t中,这离零ETL 的未来越来越近了。

我们还宣布了一项 从 亚马逊简单存储服务 (Amazon S3)到Amazon Redshift 的新自动复制功能 ,该功能使您在想要 使用 数据进行分析时无需构建和管理 ETL 管道。 而且我们不会就此止步。借助 亚马逊云科技,您现在可以连接到数百个数据源,从软件即服务 (SaaS) 应用程序到本地数据存储。

我们将继续在服务中内置零ETL功能,以帮助我们的客户轻松分析所有数据,无论这些数据位于何处。

数据治理激发创新

治理历来被用作防御措施,这意味着将数据锁定在孤岛中。但实际上, 正确的治理策略 可通过护栏帮助您更快 地移动和创新 ,让合适的人可以在需要的时间和地点访问您的数据。

除了在 亚马逊云科技 Lake Formation中进行精细的访问控制外 ,本周我们还将利用A mazon Red s hift和Amazon SageMaker发布的新功能,让客户更容易管理更多数据服务的访问和权限。

我们的客户还告诉我们,他们需要一种端到端的策略,使他们能够在 整个数据旅程中管理数据 。这就是我们本周宣布推出 Amazon DataZ one的原因 ,这是一项新的数据管理服务,可帮助您在组织内编目、发现、分析、共享和管理数据。

当你妥善管理数据的安全访问权限时,数据可能会流向正确的地方,并将各个孤立的团队和部门联系起来。

使用 亚马逊云科技 进行构建

随着本周这些新服务和功能的推出,以及我们全面的数据服务,请务必记住,在制定端到端数据策略时可以获得支持。实际上, 我们在亚马逊云科技拥有一支完整的团队 以及 广泛的合作伙伴 网络 ,可以帮助我们的客户建立数据基础,以满足他们现在和未来的需求。

如需了解有关 re: Invent 2022 的更多信息, 请访问我们的 活动页面。


作者简介

斯瓦米·西瓦苏布拉曼尼安是 亚马逊云科技 数据和机器学习副总裁。


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。