使用亚马逊 SageMaker Canvas 加快机器学习模型训练，快速实现价值的业务成果

机器学习 (ML) 可以通过高级分析帮助公司做出更好的业务决策。各行各业的公司都将机器学习应用于诸如预测客户流失、需求预测、信用评分、预测延迟发货和提高制造质量等用例。

在这篇博客文章中，我们将探讨 Amazon SageMaker Canvas 如何提供更快、更准确的模型训练时间，从而实现迭代原型设计和实验，从而加快生成更好预测所需的时间。

训练机器学习模型

SageMaker Canvas 提供了两种无需编写代码即可训练 ML 模型的方法：快速构建和标准构建。这两种方法都提供了经过全面训练的机器学习模型，包括表格数据的列影响，Quick build 侧重于速度和实验，而标准构建则提供最高的准确性。

使用这两种方法，SageMaker Canvas 都会预处理数据，选择正确的算法，探索和优化超参数空间，然后生成模型。该过程从用户那里抽象出来，在幕后完成，使用户可以专注于数据和结果，而不是模型训练的技术方面。

Housing Regression Build

缩短模型训练时间

以前，快速构建模型最多需要 20 分钟，而标准构建模型通常需要 4 个小时才能生成具有特征重要性的经过全面训练的模型。通过新的性能优化，您现在可以在不到 7 分钟的时间内获得快速构建模型，在不到 2 小时的时间内获得标准构建模型，具体取决于数据集的大小。我们通过对大小从 0.5 MB 到 100 MB 的不同数据集进行基准测试来估算这些数字。

在幕后，SageMaker Canvas 使用多种 AutoML 技术自动为您的数据构建最佳的机器学习模型。考虑到数据集的异构特征，很难事先知道哪种算法最适合特定的数据集。在返回给定数据集的最佳模型之前，SageMaker Canvas 中新引入的性能优化功能对不同的算法进行了多次试验，并在幕后训练了一系列模型。

所有这些试验中的配置是针对每个数据集并行运行的，以找到性能和延迟方面的最佳配置。配置测试包括 F1 分数和精度等客观指标，并调整算法超参数以生成这些指标的最佳分数。

改进和加快模型训练时间现在使您能够快速进行原型设计和实验，从而缩短使用 SageMaker Canvas 生成预测的价值实现时间。

Housing Regression Analyze

摘要

Amazon SageMaker Canvas 使您能够在不到 7 分钟的时间内获得经过全面训练的机器学习模型，并有助于对多个机器学习问题做出准确的预测。通过缩短模型训练时间，您可以专注于了解数据和分析数据的影响，从而实现有效的业务成果。

现在支持 SageMaker Canvas 的所有亚马逊云科技区域均提供此功能。你可以在 SageMaker Canvas 产品页面和文档中了解更多信息。

作者简介

Ajjay Govindaram 是 AW S 的高级解决方案架构师。他与使用 AI/ML 解决复杂业务问题的战略客户合作。他的经验在于为中型到大规模 AI/ML 应用程序部署提供技术指导和设计协助。他的知识范围从应用程序架构到大数据、分析和机器学习。他喜欢边休息边听音乐、体验户外活动以及与亲人共度时光。

Meenakshisundaram Thandav arayan 是 亚马逊云科技的高级人工智能/机器学习专家。他帮助高科技战略客户开启人工智能和机器学习之旅。他对数据驱动的人工智能充满热情。

Hariharan Suresh 是亚马逊云科技的高级解决方案架构师。他热衷于数据库、机器学习和设计创新解决方案。在加入亚马逊云科技之前，Hariharan 是一名产品架构师、核心银行业务实施专家和开发人员，并在 BFSI 组织工作了 11 年以上。除了科技之外，他还喜欢滑翔伞和骑自行车。

亚马逊云科技精选博客

使用亚马逊 SageMaker Canvas 加快机器学习模型训练，快速实现价值的业务成果

训练机器学习模型

缩短模型训练时间

摘要

作者简介

终止对 Internet Explorer 的支持