冷数据与热数据的划分
根据被访问的频次划分,分为冷数据和热数据。
- 热数据:半年以内被频繁访问的在线类数据,对访问频率和响应速度要求较高,可以部署在 CPU 驱动器附近,以便就近计算;
- 冷数据:非频繁访问的离线类数据,对访问频率和响应速度要求较低,可以集中化部署,保存在硬盘或远离数据中心的驱动器上。
如果以数据分析层面划分,可分为冷数据、温数据和热数据。
- 冷数据:包含性别、兴趣等个人信息,可用来绘制用户画像;
- 温数据:有关近期兴趣偏向的行为数据,存在时效性;
- 热数据:具有明显场景化特点,有利于驱动营销转化。
冷数据存储
冷数据一般存储在冷库中。由于不像热数据那样需要即时访问,因此比较适合存储相关性较低、不再具有时效性或应用频率较低的“休眠”数据信息,比如过期的项目、操作日志数据、用户灾备的个人信息、历史的财务数据、留存备用的法律相关文件以及人力资源数据等。由于它具有成本低、数据存储量大、性能要求不高、业务场景简单等特点,亚马逊云科技的 Amazon OpenSearch Service 也进行冷数据的存储,使得用户只需要在使用时,为相关计算服务付费。
冷数据管理
大数据时代,随着服务成本的持续上涨,以更低廉的价格提供更多存储容量的方案,正逐渐成为用户群体的主要诉求。然而,为灾难后进行数据恢复而存储的冷数据,势必占据大量空间。为实现冷数据存储的有效管理,可以通过择优而用、存储上云、定期评估、存储自动化这四种方法。
择优而用
您可以使用价格低廉、稳定可靠的冷存储进行数据管理。为了减少成本支出,用户一般选择将冷数据,存储在更具性价比的磁盘和运行较慢的驱动器中,并对其进行测试和定期更新,保障正常运行。
存储上云
您可以更多地考虑使用冷存储的云服务模式,对冷数据进行管理。相较于在物理环境中铺设大量基础设施的方式,云上存储不仅可以拥有更多选择,还能够实现用户对于降低成本支出的需求。
定期评估
面对必须要长期存储的大量冷数据,用户可以用筛选、评估的方式,来减轻作业量。例如,您可以与管理层和法律部门协调,确保哪些数据需要保存,哪些数据可以适当丢弃,定期进行一次新的评估。
存储自动化
大部分的服务商会选择使用分层部署的方式,对冷数据进行存储。分层部署是应用 AI 技术对数据进行智能分析,具体表现为根据人为设定的存储规则,将冷数据保存至适当的位置。
亚马逊云科技热门云产品
Amazon OpenSearch Service
搜索、可视化和分析高达 PB 字节的文本和非结构化数据
Amazon Backup
集中管理和自动执行各种亚马逊云科技服务的备份工作
Amazon S3
专为可从任何位置检索任意数量的数据而构建的对象存储
Amazon EC2
无需预先承诺,就可以安全并且可以灵活调整大小的云服务器/云主机容量
欢迎加入亚马逊云科技培训中心
欢迎加入亚马逊云科技培训中心
-
快速上手训练营
-
账单设置与查看
-
动手实操
-
快速上手训练营
-
第一课:亚马逊云科技简介
本课程帮助您初步了解云平台与本地环境的差异,以及亚马逊云科技平台的基础设施和部分核心服务,包括亚马逊云科技平台上的弹性高可用架构,架构设计准则和本地架构迁移上云的基本知识。
亚马逊云科技技术讲师:李锦鸿第二课:存储与数据库服务
您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。
亚马逊云科技资深技术讲师:周一川第三课:安全、身份和访问管理
在这个模块,您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识,责任共担模型以及身份和访问管理服务, Identity and Access Management (IAM) 。同时,通过讲师演示,您将学会如何授权给 EC2 实例,允许其访问 S3 上的资源。
亚马逊云科技技术讲师:马仲凯 -
账单设置与查看
-
-
动手实操
-