什么是热数据

热数据一般是指在半年时间以内能被频繁访问的热门数据。热数据可以根据热度是否符合预期,分为有预期的热数据和无预期的热数据两种。因为被访问频次比较高,用户更追求访问它的速度、效率,因此热数据对服务器等硬件存储设备的要求非常高,往往会保存在存储性能较强的热存储环境中,或将其部署在 CPU 驱动器附近,以便可以进行就近计算。同时,它还需要一定程度的存储能力和带宽支持,才能保证在用户访问时,画面显示清晰、不卡顿。

热数据探测

我们一般会采用将数据提前缓存到本地的方式,缓解读取热数据时对服务器的压力。在此之前,我们需要用热数据检测的方式将热数据找出来。首先,我们要给热数据的“热”度,设定一个标准或区间。然后就可以针对单机应用和分布式应用采用不同的方法进行热度探测了。单机应用可以为每一个数据设定一个滑动窗口计数器,用来统计单位时间内数据被访问的次数,再将检测到的热数据集中存储;分布式应用需要设立独立运行的热度计算单元,并将分布在不同服务器的热数据集合起来。另外,热数据探测可能会面对多变复杂的场景,可能要考虑其他的问题。

冷热数据分离

冷热数据分离的根本目的,在于控制成本。如果统一存储在高效的服务器中,要保证热数据的正常运行,花费非常大;而如果将数据存储在配置较低的服务器中,虽然成本相对降低,但无法保证用户对热数据的正常访问。所以我们一般会将冷数据与热数据分离开,并存储在不同的环境、配备不同的设施。对于热数据,由于需要保证高效的读写性能问题,会优先选择 MySQL、Elasticsearch 等数据库;而对于冷数据,因为不需要高频访问,所以可以采用成本较低的存储方式。

判断冷热数据的算法

一般情况,我们判断数据属于冷数据还是热数据的标准是访问的频次和访问的时效性,因此我们依据这两种标准,设计出基于特定数据结构、统计学、机器学习三类算法来进行精准预测。

判断冷热数据的算法_数据结构特点的判断算法

数据结构特点的判断算法

我们还会依据能否满足数据结构的双重特点来区分冷、热数据,这样的判断算法有传统版和改良版两种。传统版的算法因为只能满足结构特点其中一个的需求,所以很少应用,而经过改良的算法等已经可以兼顾两种结构特点。

判断冷热数据的算法_统计学的判断算法

统计学的判断算法

基于统计学的判断算法是利用统计模型来进行冷热数据的判断的。 它根据数据的访问特征提出一个算法模型,然后利用这个模型来进行冷热数据判别。例如,可以将温度的冷热与数据的冷热相结合,根据牛顿定律构建一个温度判断算法模型,再利用它预测热度。

判断冷热数据的算法_机器学习的判断算法

机器学习的判断算法

基于机器学习的判断算法,就是利用机器学习的能力,预测数据是否会转变成热数据。 比如,首先获取核心数据,然后运用模型对核心数据进行抽取并预测其热点程度,最后利用机器学习算法对上述过程进行学习,再应用到其他数据的热度预测中。

亚马逊云科技热门云产品

Amazon EC2

Amazon EC2

无需预先承诺,就可以安全并且可以灵活调整大小的云服务器/云主机容量

 Amazon  OpenSearch Service

Amazon OpenSearch Service

搜索、可视化和分析高达 PB 字节的文本和非结构化数据

Amazon S3

Amazon S3

专为可从任何位置检索任意数量的数据而构建的对象存储

Amazon IoT SiteWise

Amazon IoT SiteWise

轻松地从工业设备中大规模收集、组织和分析数据

欢迎加入亚马逊云科技培训中心

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
  • 快速上手训练营
  • 第一课:亚马逊云科技简介

    本课程帮助您初步了解云平台与本地环境的差异,以及亚马逊云科技平台的基础设施和部分核心服务,包括亚马逊云科技平台上的弹性高可用架构,架构设计准则和本地架构迁移上云的基本知识。

    亚马逊云科技技术讲师:李锦鸿

    第二课:存储与数据库服务

    您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。

    亚马逊云科技资深技术讲师:周一川

    第三课:安全、身份和访问管理

    在这个模块,您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识,责任共担模型以及身份和访问管理服务, Identity and Access Management (IAM) 。同时,通过讲师演示,您将学会如何授权给 EC2 实例,允许其访问 S3 上的资源。

    亚马逊云科技技术讲师:马仲凯
  • 账单设置与查看
  • 视频:快速完成税务设置

    部署时间:5 分钟

    视频:账户账单信息

    部署时间:3 分钟

    视频:如何支付账单

    部署时间:3 分钟

  • 动手实操
  • 快速上手云上无服务器化的 MySQL 数据库

    本教程将引导您创建一个Aurora Serverless 数据库并且连接上它。

    部署时间:10 分钟

    启动一台基于 Graviton2 的 EC2 实例


    本教程将为您讲解如何在云控制台上启动一台基于 Graviton2 的 EC2 实例。

    部署时间:5 分钟

    使用 Amazon Systems Manager 进行云资源统一跟踪和管理

    在这个快速上手教程中,您将学会如何使用 Amazon Systems Manager 在 Amazon EC2 实例上远程运行命令。

    部署时间:10 分钟

准备好体验亚马逊云科技提供的云服务了吗?

新用户享受中国区域 12 个月免费套餐

快速注册账号 享用免费套餐

快速注册账号 享用免费套餐

跟随注册步骤详解,三分钟快速创建账号,领取免费权益   立即注册 »

跟随注册步骤详解,三分钟快速创建账号,领取免费权益   立即注册 »

  • 1 进入注册页面
  • 1. 打开中国区

    输入邮箱 - 邮箱验证

    1. 打开中国区 账号注册页面

    输入邮箱 - 邮箱验证
    01
    填写您
    注册账号的邮箱
    点击“继续”
    01
    填写您
    注册账号的邮箱
    点击“继续”
    02
    查看您的
    注册账号邮箱
    02
    查看您的
    注册账号邮箱
    03
    输入
    邮箱中收到的验证码
    点击“继续”
    03
    输入
    邮箱中收到的验证码
    点击“继续”
    注:该链接中的内容显示语言 是与您的网页浏览器设置相一致的,您可以根据需要自行调整语言栏。 *图片点击可放大
  • 2 设置用户名及密码
  • 2. 填写用户名密码

    设置用户名 - 设置密码 - 确认密码

    2. 填写用户名密码

    设置用户名 - 设置密码 - 确认密码
    01
    请设置您的
    账号用户名
    *例如: webchina
    01
    请设置您的
    账号用户名
    *例如: webchina
    02
    为您的帐号
    设置密码
    02
    为您的帐号
    设置密码
    03
    重新
    输入密码
    03
    重新
    输入密码
    *图片可点击放大
  • 3 填写企业信息
  • 3. 填写账号联系人以及公司信息

    3. 填写账号联系人以及公司信息

    填写姓名 - 填写联系电话 - 填写公司名称 - 填写办公地址 - 选择是否需要发票 - 点击查看客户协议
    填写姓名 - 填写联系电话 - 填写公司名称 - 填写办公地址 - 选择是否需要发票 - 点击查看客户协议
    01
    填写公司联系人
    姓名全称
    01
    填写公司联系人
    姓名全称
    02
    填写公司联系人的
    联系电话
    02
    填写公司联系人的
    联系电话
    03
    填写
    公司名称
    *重要! ! !公司名称请务必与您所提供的营业执照公司名称保持一致
    03
    填写
    公司名称
    *重要! ! !公司名称请务必与您所提供的营业执照公司名称保持一致
    04
    填写
    公司办公地址
    省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码
    04
    填写
    公司办公地址
    省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码
    05
    请选择
    是否需要发票
    05
    请选择
    是否需要发票
    06
    点击查看
    客户协议
    勾选方框表示您已阅读,并同意客户协议的条款
    06
    点击查看
    客户协议
    勾选方框表示您已阅读,并同意客户协议的条款
    *图片可点击放大
  • 4 企业信息验证
  • 4. 企业信息验证

    上传企业执照 - 填写负责人姓名 - 填写联系方式 -上传身份证件

    4. 企业信息验证

    上传企业执照 - 填写负责人姓名 - 填写联系方式 -上传身份证件
    01
    在此上传
    企业注册执照
    01
    在此上传
    企业注册执照
    02
    请填写网络安全负责人的
    姓名

    请注意: 该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

    02
    请填写网络安全负责人的
    姓名

    请注意: 该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

    03
    请填写网络安全负责人的
    联系方式
    有效的电子邮件地址 - 有效的中国内地 手机号码 - 座机号码(如无座机,请填写正确有效的手机号码)
    03
    请填写网络安全负责人的
    联系方式
    有效的电子邮件地址 - 有效的中国内地 手机号码 - 座机号码(如无座机,请填写正确有效的手机号码)
    04
    在此上传网络安全负责人的
    身份证件

    请注意:当您选择证件类型为“身份证”时,您需要填写正确的身份证号码,选择其他证件类型时,您需要上传证件扫描稿

    04
    在此上传网络安全负责人的
    身份证件

    请注意:当您选择证件类型为“身份证”时,您需要填写正确的身份证号码,选择其他证件类型时,您需要上传证件扫描稿

    *图片可点击放大
  • 5 完成手机验证
  • 5. 完成手机验证

    输入手机号 - 输入验证码

    5. 完成手机验证

    输入手机号 - 输入验证码
    01
    在此填写
    手机号
    01
    在此填写
    手机号
    02
    请输入您收到的
    4 位
    验证码
    02
    请输入您收到的 4 位
    验证码
    03
    请点击
    继续
    03
    请点击
    继续
    *图片可点击放大
  • 6 选择支持计划
  • 6. 选择支持计划

    选择一个亚马逊云科技支持计划

    6. 选择支持计划

    选择一个亚马逊云科技支持计划
    请根据需求
    选择一个支持计划
    请根据需求
    选择一个支持计划
    *图片点击可放大
限时钜惠

免费试用 Amazon EC2 T4g 实例

新老用户现可享受每月 750 小时的免费 t4g.small 实例使用时长,优惠期至 2025 年 12 月 31 日!