首页  云计算知识 
什么是数据科学

什么是数据科学?

什么是数据科学?数据科学是一门涉及机器学习、数学、统计学、高性能计算的交叉学科,主要用于从数据中提取价值,包括数据收集、数据清理与聚合、数据描述、发现知识、提交审查的一整套流程,最终对需要解决的问题提出合理的预测和建议。

新用户享受中国区域 12 个月免费套餐

什么是数据科学?
首页  云计算知识 
什么是数据科学
移动应用是什么?

什么是数据科学?

什么是数据科学?数据科学是一门涉及机器学习、数学、统计学、高性能计算的交叉学科,主要用于从数据中提取价值,包括数据收集、数据清理与聚合、数据描述、发现知识、提交审查的一整套流程,最终对需要解决的问题提出合理的预测和建议。

新用户享受中国区域 12 个月免费套餐

数据科学与机器学习

数据科学与机器学习

机器学习是数据科学的一部分。数据科学更加注重运用数学、统计学等计算科学从数据中提取价值;机器学习则更加注重用数据获取经验,在不断学习中改进算法性能并自动优化计算机模型。随着近年来爆发式增长的数据,数据科学与机器学习呈现出相辅相成的关系。数据科学收集分析的大量数据为机器学习提供了充足的数据集,而机器学习因为自身强大的学习能力和优秀算法的支持,能够帮助数据科学做出符合数据发展趋势的判断并提供具有战略性意义的指导。在大数据时代,数据科学与机器学习已然成为从数据中获取价值的两个重要手段。

数据科学的流程

定义计划_数据科学的流程

定义计划

基于要解决的问题,提出对应项目的构想,然后对项目流程做出计划安排,并对结果做出合理预测。

获取数据_数据科学的流程

获取数据

思考我们需要什么数据,这些数据中哪些又可以作为关键数据,数据的格式又有什么要求等,这些都是数据科学执行中的关键工作。

模型的构建与评估_数据科学的流程

模型的构建与评估

数据科学的机器学习模型需要大量数据组成的数据集来进行训练。数据集一般包括训练集、测试集和验证集。其中验证集上的准确度是评估指标的关键。此外,数据科学的模型还应当以通用接口的形式实现自主获取数据、数据分析处理以及数据可视化评估等,从而形成一套完整的模型与函数体系。

模型的部署与完善_数据科学的流程

模型的部署与完善

为了便于部署,可以将机器学习模型以接口的形式由数据库来调用,同数据库的各种函数一样,这也是对数据库功能的拓展。在数据库中,将我们训练的机器学习模型和设计的函数应用到数据上,观察最终结果和我们预期是否一致,并基于此不断改进完善。迭代改进正是数据科学常见的生命周期流程。

数据科学的流程

定义计划_数据科学的流程

定义计划

基于要解决的问题,提出对应项目的构想,然后对项目流程做出计划安排,并对结果做出合理预测。

获取数据_数据科学的流程

获取数据

思考我们需要什么数据,这些数据中哪些又可以作为关键数据,数据的格式又有什么要求等,这些都是数据科学执行中的关键工作。

模型的构建与评估_数据科学的流程

模型的构建与评估

数据科学的机器学习模型需要大量数据组成的数据集来进行训练。数据集一般包括训练集、测试集和验证集。其中验证集上的准确度是评估指标的关键。此外,数据科学的模型还应当以通用接口的形式实现自主获取数据、数据分析处理以及数据可视化评估等,从而形成一套完整的模型与函数体系。

模型的部署与完善_数据科学的流程

模型的部署与完善

为了便于部署,可以将机器学习模型以接口的形式由数据库来调用,同数据库的各种函数一样,这也是对数据库功能的拓展。在数据库中,将我们训练的机器学习模型和设计的函数应用到数据上,观察最终结果和我们预期是否一致,并基于此不断改进完善。迭代改进正是数据科学常见的生命周期流程。

数据科学的应用举例

数据科学的应用举例

零售业

为什么有些公司可以成为零售业的巨头?这离不开对数据科学的充分利用。例如,数据科学可以对商品的价格调整给出建议、对用户的需求进行预测、对不断变化的供给关系进行管理等,从而在整个供应链的调整上发挥关键作用。

公共部门

由于决策数量的不断增和及决策的复杂化,数据科学在公共部门也有着巨大的应用价值。使用数据科学可以提高问题决策的效率,并在准确有效、公平公正等方面也有进一步提升,从而帮助决策者使用更好的策略应对未来的发展。

银行业

数据科学已广泛应用于很多关键的银行业务,包括客户情报、风险投资管理以及诈骗检测等,甚至很多关键业务由数据科学驱动发展。在竞争激烈的银行业中,数据科学的使用价值愈加凸显。

亚马逊云科技数据科学相关产品

亚马逊云科技数据科学相关产品

Amazon SageMaker

Amazon SageMaker


适用于每位开发人员和数据科学家的机器学习

Amazon EMR

Amazon EMR


托管的 Hadoop 框架

Amazon Deep Learning AMI

Amazon Deep Learning AMI


快速构建深度学习应用程序

Amazon Step Functions

Amazon Step Functions


使用可视化工作流构建分布式应用程序

准备好免费体验亚马逊云科技相关数据科学产品了吗?
准备好免费体验亚马逊云科技相关数据科学产品了吗?

新用户注册,可免费体验 12 个月

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多
官方开发资源及培训教程