高效运维物联网解决方案指南

此亚马逊云科技解决方案有何用途 ?

智能互联产品厂商将海量设备同时接入,当用户端出现故障,传统的设备运维,厂商的反应往往是很被动,透过终端用户联系客服反映问题,反馈给生产管理者,再分配给运维人员,这种处理故障的被动运维模式,用户得到很差的体验,极大浪费了资源。

如何快速发现,应对设备的突发故障和常见问题,使用亚马逊云科技服务帮助我们迅速构建出设备数据收集分析这套机制,可用于搜集设备日志及应用程式等各种来源的日志资讯,进行故障分析归类并集中储存管理。透过完善的日志分析管理,能更轻松的协助企业快速查找问题并修正设备故障。

并且利用 Amazon Connect 和 Amazon Lex,我们可以充分发挥技术的力量,利用机器人给出的最准确的答案,帮助运维人员提高工作效率。减少处理故障的被动运维模式,给用户的透明度以赢得用户信任,从而尽可能提供最优客户体验。

解决的问题与痛点

客户手中的设备发生大规模问题时,我如何尽早知道?

如果同时发生多个问题,我如何判断严重性、优先级?

就算我知道发生问题了,开发团队能够快速解决吗?

大量用户求助时,客服团队有能力应对吗?

方案优势

低成本

采用无服务器架构,大幅降低基础设施的开销,精准的判断与分析设备故障与常见问题,提高排错效率,减少运营人力成本。

开箱即用

云端服务提供 CDK 自动化部署完整解决方案,并提供设备端代码的集成参考。

代码开源

此方案中所有代码均以开源的形式提供,设备商能根据需求,自行集成代码并运行在本地设备。

解决方案概述

以下架构图展示了整个方案的部署架构(可单击放大查看):

  • 设备故障日志收集分析
  • 1. 互联设备可透过 MQTT 协议将设备随机出现的严重问题,例如软件崩溃,死锁,过热重启等,以及设备常见的错误码,自动报告给 Amazon IoT Core

    • b. 设备常见的错误码透过 Amazon IoT 规则将 MQTT 消息写入 Amazon Timestream

    2. 互联设备也可透过 HTTP 协议直接将设备的错误日志直接上传到 Amazon S3,调用指定的 Amazon Lambda 函数

    3. Amazon Lambda 函数作为接口,当接收到请求时,驱动 Amazon Step Functions 工作流程, 调用服务来执行任务

    4. Amazon Step Functions 依照 Task Definition DB 关联的设备类型,将构建任务提交给对应的计算服务以满足各种需求

    • a. Amazon CodeBuild ,在容器中运行构建任务,完成后丢弃容器。Amazon CodeBuild 可以并发运行各个构建任务,构建任务不会在队列中等待
    • b. Amazon Lambda,无服务器服务响应事件 ,大规模快速处理数据

    5. 使用 Amazon Timestream 收集分析结果。借助 Amazon Managed Grafana 将 Amazon Timestream 添加为数据源,实时分析数据以协助识别设备故障趋势

    • a. 设备随机出现的严重问题数据源
    • b. 设备常见的错误码数据源

    6. CrashBoard 作为可视化平台为产品运维团队、测试人员等不同角色提供运维监控、设备故障分析等跨数据源统一看板

    7. 制造业可选用 Amazon IoT Greengrass,自订的模组上传设备故障讯息,並借助合作伙伴所提供的 PLC 做工业自动化设备协议转换,远程监控工业设备快速发现问题

  • 人工+AI 客服交互
    1. 设备用户透过手机 app 登入智能客服系统,从 Amazon Lex 取得 AI 客服机器人的即时回应
    2. 使用 Amazon Lambda 作为 Amazon Lex 的代码挂钩的函数,返回给客户端后用户应执行的操作
    3. Bot Fulfillment 访问 Log Analysis 模块取得设备异常报错的详细资讯,并立即返回设备异常的处理方法给客用端用户
    4. 若 AI 客服机器人无法解决用户问题,用户可经由手机 app 连线,从 Amazon Connect 取得人工客服的立即协助
    5. 客服人员可以经由登入 HelpDesk 工作台,利用 Amazon Connect 自动移交谈话到人工座席,以确保设备用户对话的完整性,提升人工作业效率与客户满意度
    6. 客服人员查询 Knowledge Base 模块,根据设备用户所提供的设备讯息进行搜索,并取得设备关键错误码与详细的设备资讯。通过研发工程团队提供的解决方案,精准的回应用户设备故障的原因与解决对策,降低联络中心的成本
    7. Log Analysis 模块调用 Amazon Timestream 取得设备关键错误码,搜索 Knowledge Base DB 取得关键错误码对应之业务决策,返还给客服人员
    8. 若客服人员无法在 Knowledge Base 模块内搜索出相应答案,可通过 HelpDesk 单一搜索界面提交新的错误码,存储于 Amazon DynamoDB,经由管理者批准,研发工程团队立即分析设备问题并提供业务决策所需的见解,然后丰富客服人员搜索
    9. Amazon Connect Contact Lens 提供客户对话转录为文本并存储于 Amazon S3,发现客户互动中最常见的意图和相关信息,可通过 Lex Chatbot Designer,从对话记录中自动设计 AI 客服机器人

开始使用亚马逊云科技免费构建

开始使用亚马逊云科技免费构建

关闭
热线

热线

1010 0766
由光环新网运营的
北京区域
1010 0966
由西云数据运营的
宁夏区域