我们使用机器学习技术将英文博客翻译为简体中文。您可以点击导航栏中的“中文(简体)”切换到英文版本。
在 8—12 周内交付您的第一个 ML 用例
您是否需要帮助才能将组织的机器学习 (ML) 之旅从试点推向生产?你并不孤单。大多数高管认为机器学习可以应用于任何业务决策,但平均而言,只有一半的机器学习项目将其应用于生产。
这篇文章介绍了如何利用一种
挑战
客户在实施机器学习 (ML) 解决方案时可能会面临一些挑战。
- 您可能难以将机器学习技术工作与业务价值主张联系起来,这使得 IT 和业务领导层难以证明实施模型所需的投资是合理的。
- 您通常会选择低价值用例作为概念验证,而不是解决有意义的业务或客户问题。
- 您可能在技能和技术方面存在差距,包括操作机器学习解决方案、实施机器学习服务和管理机器学习项目以实现快速迭代。
- 确保数据质量、治理和安全可能会减缓或阻碍机器学习项目。
解决方案概述:基于机器学习体验的加速 (ML EBA)
机器学习 EBA 是一个为期 3 天、以冲刺为基础的交互式研讨会(称为 派对 ),使用 SageMaker 指导您完成加速的、规范性的机器学习生命周期,从而加速实现业务成果。它从确定业务目标和机器学习问题框架开始,然后引导您完成数据处理、模型开发、生产部署和监控。
以下视觉效果说明了 ML 生命周期示例。
有两个主要的客户场景适用。第一种是使用低代码或无代码机器学习服务,例如亚马逊 SageMaker C
我们认识到,客户有不同的起点。如果你是从头开始,通常更简单的方法是从低代码或无代码解决方案开始,然后逐渐过渡到开发自定义模型。相比之下,如果您拥有现有的本地 ML 基础架构,则可以直接使用 SageMaker 来缓解当前解决方案面临的挑战。
通过 ML EBA,经验丰富的 亚马逊云科技 ML 主题专家与您的跨职能团队并肩工作,为持续采用机器学习提供规范性指导、消除障碍并增强组织能力。该派对引导你解决引人注目的业务问题,而不是从数据和机器学习技术环境的角度来考虑。此外,该派对可以让你开始利用未开发的数据推动物质业务价值。
ML EBA 可帮助您从大处着眼、从小处着手,快速扩展。尽管它在 3 天内创建了最低可行的 ML 模型,但在 EBA 之前还有 4-6 周的准备时间。此外,在 EBA 之后,您需要花 4-6 周的时间在生产部署之前通过额外的特征工程和超参数优化来微调模型。
让我们深入了解整个过程是什么样子,以及如何使用 ML EBA 方法来解决常见的阻碍因素。
EBA 备考(4-6 周)
在本节中,我们将详细介绍 EBA 之前的 4-6 周准备工作。
派对开始前 6 周:问题框架和资格认证
第一步是构造和限定机器学习问题,其中包括以下内容:
-
确定正确的业务成果
— 您必须清楚地了解自己想要解决的问题以及希望通过使用机器学习实现的预期结果。您必须能够根据特定目标和成功标准来衡量获得的业务价值。此外,你必须能够确定应该观察到什么,应该预测什么。在开始 ML EBA 之前,亚马逊云科技 与您合作,帮助回答以下重要问题:机器学习
- 用例能解决有意义的业务问题 吗?
- 引起商界领导的注意是否足够重要?
- 你已经有数据可以解决机器学习用例了吗?
- 该用例最终能否投入生产?
- 它真的需要机器学习吗?
- 是否有组织流程让企业使用模型的输出?
- 高管赞助 — 为了帮助您比自然更快地行动,亚马逊云科技 会与执行赞助商会面,以确认支持、消除内部障碍并投入资源。此外,亚马逊云科技 可以提供经济激励措施,帮助抵消您的第一个 ML 用例的成本。
- 在机器学习之旅中与您会面 — 亚马逊云科技 会评估您的当前状态——人员、流程和技术。我们帮助您详细说明要求和依赖关系;具体而言,需要哪些团队和数据才能成功开始旅程。此外,我们还就技术路径提供建议:从低代码或无代码服务开始,或者使用 SageMaker 构建自定义模型。
晚会前 5 周:工作流配置和过渡到行动中
下一步是确定支持EBA工作所需的团队。通常,工作分为以下工作流:
-
云工程(基础设施和安全)
— 重点是在EBA之前验证亚马逊云科技账户和基础设施是否已设置并安全。
这包括 亚马逊云科技身份和访问管理 (IAM) 或单点登录 (SSO) 访问、安全护栏、Amazon SageMakerStudio 配置、为节省成本而自动停止/启动以及亚马逊简单存储服务 (Amazon S 3) 设置。 - 数据工程 -识别数据源,设置数据摄取和管道,并使用 Data Wrangler 准备数据。
- 数据科学 — ML EBA 的核心,专注于特征工程、模型训练、超参数调整和模型验证。
- mLops 工程 — 重点是自动化 DevOps 管道以实施机器学习用例。这通常与云工程团队是同一个团队。
- 领导团队 -负责协调工作,消除障碍,与执行赞助商保持一致,并最终负责实现预期结果。
在这些努力完成之后,我们必须过渡到行动中。应严格遵守标准的4周基准时间表,以确保EBA步入正轨。经验丰富的 亚马逊云科技 主题专家将指导和指导您完成 EBA 派对前的准备工作。
派对前 4 周:激励建筑商并制定技术计划
每个客户都不一样;亚马逊云科技 可以帮助您制定活动技术计划,计划将在派对前的未来 4 周内完成。
亚马逊云科技 举办 “沉浸式日”,以激励您的建筑商并为派对营造动力。沉浸式日是半天或一整天的研讨会,将演示、动手实验和问答完美结合在一起,以介绍 亚马逊云科技 服务或解决方案。亚马逊云科技 将帮助您从
我们认识到,贵组织中的每位建设者都处于不同的水平。我们建议您的建设者使用
派对前 3 周:技术准备工作侧重于云和数据工程
您的云和数据工程团队应在 亚马逊云科技 的指导下开展以下工作:
- 创建具有网络和安全设置的 亚马逊云科技 账户
- 设置亚马逊 SageMaker Studio
- 创建 Amazon S3 存储桶来存储数据
- 识别数据源(或生产者)
- 集成外部源以将数据转储到 S3 存储桶
派对前 2 周:技术准备工作侧重于数据科学
您的数据科学团队应在 亚马逊云科技 的指导下开展以下工作:
- 测试与机器学习用例相关的 SageMaker 示例笔记本。
- 进行探索性分析和数据准备。
-
确定机器学习算法(如果已知或可能)。否则,请使用
亚马逊 SageMaker Autopil ot pStart。或 亚马逊 SageMaker Jum - 与 Git 或 SonarQube 等外部持续集成和持续部署 (CI/CD) 工具集成。
-
参加 亚马逊云科技 对 SageMaker 功能的演练或深入探讨,例如 亚马逊 SageMaker 实验 、亚马逊 SageMaker Clarify、亚马逊 SageMaker 调试器和亚马逊 SageMaker 模型监视器,这些功能可能是 EBA 所必需的。
派对前 1 周:评估准备情况(go/no-go)
亚马逊云科技 与您合作,评估参加技术活动的准备情况、技能和派对势头。然后,我们将巩固为期3天的聚会的范围,优先考虑进度而不是完美。
EBA(为期 3 天的派对)
尽管 EBA 派对本身是为您的组织定制的,但建议的 3 天日程安排如下表所示。在 EBA 期间,您将在 亚马逊云科技 主题专家的指导下边做边学。
| . | Day 1 | Day 2 | Day 3 |
| Data Science |
上午:试试 AutoPilot 或 JumpStart 模型。 下午:根据自动驾驶结果选择 1-2 个模型进行进一步实验。 |
Improve model accuracy:<p></p>
|
使用测试数据进行质量保证和验证。 部署到生产环境(推理端点)。 监控设置(模型、数据漂移)。 |
| Data Engineering | Explore using feature store for future ML use cases. Create a backlog of items for data governance and associated guardrails. | ||
| Cloud/MLOps Engineering |
Evaluate the
|
Implement backlog items to create a repeatable MLOps framework. | Continue implementing backlog items to create a repeatable MLOps framework. |
EBA 之后
机器学习涉及大量实验,在 3 天的 EBA 期间通常无法达到所需的模型精度。因此,创建明确定义的待办事项列表或生产路径至关重要,包括通过实验、特征工程、超参数优化和生产部署提高模型准确性。亚马逊云科技 将继续协助您完成生产部署。
结论
通过使用 SageMaker 对 ML EBA 方法进行补充,您可以获得以下结果:
- 在 8-12 周内从试点转变为生产价值 — 召集业务和技术团队,在 8-12 周内将第一个 ML 用例部署到生产环境中。
- 增强组织能力,跨业务部门加快和扩展机器学习 — ML EBA 通过真实的工作经验激励和提高建设者的技能。它建立了成功的工作模式(协作和迭代模型),以维持和扩展跨业务部门的机器学习计划。它还创建了可重复使用的资产,以可重复的方式加快和扩展机器学习。
- 减少现有本地 ML 模型的技术债务、痛点和成本 ——本地解决方案可能面临与成本上涨、无法扩展基础架构、无差别基础设施管理以及缺乏高级功能集(例如超参数优化、预测可解释性等)相关的挑战。采用 SageMaker 等 亚马逊云科技 机器学习服务可以减少这些问题。
联系您的 亚马逊云科技 账户团队(客户经理或客户解决方案经理)以了解更多信息并开始使用。
作者简介
Ritesh Shah
是亚马逊网络服务的高级客户解决方案经理。他帮助美国中部的大型企业加速其支持云的转型并构建现代云原生解决方案。他热衷于加速客户的机器学习之旅。在空闲时间,Ritesh 喜欢与女儿共度时光、烹饪和学习新知识,同时还喜欢传播云和机器学习。在
Nicholaus Lawson
是 亚马逊云科技 的解决方案架构师,也是 AIML 专业小组的一员。他拥有软件工程和人工智能研究的背景。工作之余,Nicholaus 经常编程、学习新知识或做木工。在
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。