发布于: Oct 18, 2021

Amazon SageMaker 宣布推出一组新的功能,支持通过 SageMaker Studio 笔记本进行基于 Spark 的交互式数据处理。Amazon SageMaker Studio 是首个用于机器学习 (ML) 的完全集成式开发环境 (IDE)。SageMaker Studio 提供了一个单一的、基于 Web 的可视化界面,您可以在其中执行准备数据以及构建、训练和部署模型所需的所有机器学习开发步骤。只需单击一下,数据科学家和开发人员即可快速启动 Studio 笔记本,以交互式方式探索数据集和构建机器学习模型。

即日起,数据科学家和数据工程师只需点击几下即可通过其 Studio 笔记本直观地浏览、发现和连接到 Amazon EMR 上运行的 Spark 数据处理环境。连接后,他们可以交互式查询、浏览和可视化数据,并使用适用于 Python 和 Scala 的内置 SparkMagic 笔记本环境运行 Spark 作业。

分析、转换和准备大量数据是任何数据科学和机器学习工作流程的基础步骤,企业越来越多地利用 Apache Spark 来快速准备数据。SageMaker Studio 已提供有专门构建的工具,如 Experiments、Clarify 和 Model Monitor for ML。借助新推出的功能,客户可以从 Studio 笔记本轻松访问专门构建的 Spark 环境。因此,SageMaker Studio 可以用作数据科学和数据工程工作流程的统一环境,从而支持客户在 Studio 笔记本上标准化数据工作流程。

SageMaker Studio 中的这些新数据分析功能现已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域中全面推出。要详细了解 SageMaker Studio,请访问 SageMaker 用户指南