发布于: Sep 6, 2022

EMR Studio 是一个集成开发环境 (IDE),它使数据科学家和数据工程师可以更轻松地开发、可视化并调试大数据和以 R、Python、Scala 和 PySpark 编写的分析应用程序。今天,我们非常高兴地宣布,EMR Studio 现已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域推出。

EMR Studio 提供完全托管式 Jupyter Notebook,用于在 EMR 上运行交互式工作负载。它还提供 Spark UI 和 YARN 时间轴服务等工具来简化调试。EMR Studio 的用户可以安装自定义内核和库,使用 GitHub 和 BitBucket 等代码存储库与同行协作,或者使用编排服务(如 Apache Airflow)将参数化笔记本作为计划工作流程的一部分来执行。

管理员可以设置 EMR Studio,以便分析师可以在现有 EMR 集群上运行其应用程序,或者使用针对 EMR 的预定义 Amazon CloudFormation 模板创建新集群。EMR Studio 在 EMR 发行版 5.32.0 和 6.2.0 及更高版本上正式推出。

您可以通过阅读 Amazon EMR Studio 文档或访问 Amazon EMR Studio 详情页面来了解更多信息。