发布于: Sep 14, 2022

Amazon SageMaker Studio 是面向机器学习(ML)的完全集成开发环境(IDE),让数据科学家和开发人员能够执行机器学习流程的每个步骤,不管是准备数据还是构建、训练、微调和部署模型。SageMaker Studio 内置可快速启动的协作笔记本。您可以在 Studio 中快速启动笔记本,轻松调高或调低底层计算资源而不中断工作,甚至通过几次简单的点击以链接形式分享您的笔记本。 今天,我们很高兴地宣布,Amazon SageMaker Studio 现在提供支持与 Amazon Glue 交互式会话集成的内置功能。数据科学家和数据工程师可以使用由 Glue 交互式会话管理的无服务器 Apache Spark 运行时环境,直接在其 Studio 笔记本中以交互式方式大规模准备数据。

您可以轻松地使用 SageMaker Studio Notebooks 的 Glue 交互式会话;只需为您的 Studio 笔记本选择内置的 Glue PySpark 或 Glue Spark 内核,即可在数秒之内启动交互式的无服务器 Spark 会话,而不必担心预置和管理复杂的计算集群基础设施。启动后,您可以在 Studio 笔记本中利用 Spark 快速浏览 Glue 数据目录、运行大型查询,以及交互式地分析与准备数据。然后,您可以借助 SageMaker Studio 中专门构建的 ML 工具,并使用准备的数据来构建、训练、微调以及部署模型。 

SageMaker Studio 中的 Glue 交互式会话功能已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域全面开放。要详细了解 SageMaker Studio,请访问 SageMaker 用户指南