使用亚马逊 SageMaker Canvas 加快机器学习模型训练,快速实现价值的业务成果

机器学习 (ML) 可以通过高级分析帮助公司做出更好的业务决策。各行各业的公司都将机器学习应用于诸如预测客户流失、需求预测、信用评分、预测延迟发货和提高制造质量等用例。

在这篇博客文章中,我们将探讨 Amazon SageMaker Canvas 如何提供更快、更准确的模型训练时间,从而实现迭代原型设计和实验,从而加快生成更好预测所需的时间。

训练机器学习模型

SageMaker Canvas 提供了两种无需编写代码即可训练 ML 模型的方法:快速构建和标准构建。这两种方法都提供了经过全面训练的机器学习模型,包括表格数据的列影响,Quick build 侧重于速度和实验,而标准构建则提供最高的准确性。

使用这两种方法,SageMaker Canvas 都会预处理数据,选择正确的算法,探索和优化超参数空间,然后生成模型。该过程从用户那里抽象出来,在幕后完成,使用户可以专注于数据和结果,而不是模型训练的技术方面。

Housing Regression Build

缩短模型训练时间

以前,快速构建模型最多需要 20 分钟,而标准构建模型通常需要 4 个小时才能生成具有特征重要性的经过全面训练的模型。通过新的性能优化,您现在可以在不到 7 分钟的时间内获得快速构建模型,在不到 2 小时的时间内获得标准构建模型,具体取决于数据集的大小。我们通过对大小从 0.5 MB 到 100 MB 的不同数据集进行基准测试来估算这些数字。

在幕后,SageMaker Canvas 使用多种 AutoML 技术自动为您的数据构建最佳的机器学习模型。考虑到数据集的异构特征,很难事先知道哪种算法最适合特定的数据集。在返回给定数据集的最佳模型之前,SageMaker Canvas 中新引入的性能优化功能对不同的算法进行了多次试验,并在幕后训练了一系列模型。

所有这些试验中的配置是针对每个数据集并行运行的,以找到性能和延迟方面的最佳配置。配置测试包括 F1 分数和精度等客观指标,并调整算法超参数以生成这些指标的最佳分数。

改进和加快模型训练时间现在使您能够快速进行原型设计和实验,从而缩短使用 SageMaker Canvas 生成预测的价值实现时间。

Housing Regression Analyze

摘要

Amazon SageMaker Canvas 使您能够在不到 7 分钟的时间内获得经过全面训练的机器学习模型,并有助于对多个机器学习问题做出准确的预测。通过缩短模型训练时间,您可以专注于了解数据和分析数据的影响,从而实现有效的业务成果。

现在支持 SageMaker Canvas 的所有 亚马逊云科技 区域均提供此功能。 你可以在 SageMaker Canvas 产品页面 和文档中 了解更多信息。


作者简介

Ajjay Govindaram 是 AW S 的高级解决方案架构师。他与使用 AI/ML 解决复杂业务问题的战略客户合作。他的经验在于为中型到大规模 AI/ML 应用程序部署提供技术指导和设计协助。他的知识范围从应用程序架构到大数据、分析和机器学习。他喜欢边休息边听音乐、体验户外活动以及与亲人共度时光。

Meenakshisundaram Thandav arayan 是 亚马逊云科技 的高级人工智能/机器学习专家。他帮助高科技战略客户开启人工智能和机器学习之旅。他对数据驱动的人工智能充满热情。

Hariharan Suresh 是 亚马逊云科技 的高级解决方案架构师。他热衷于数据库、机器学习和设计创新解决方案。在加入 亚马逊云科技 之前,Hariharan 是一名产品架构师、核心银行业务实施专家和开发人员,并在 BFSI 组织工作了 11 年以上。除了科技之外,他还喜欢滑翔伞和骑自行车。