数据冗余有哪些类型

空间冗余

空间冗余常出现在图像数据中。当某些像素的数据完全相同时,逐点储存就会产生空间数据冗余。为避免出现空间冗余,可对完全一致的像素数据进行压缩,相似度较高的数据也可以进行压缩,在数据恢复后图片与原图并不完全一致,但其中的区别人眼难以分辨,利用此种特性实现对空间冗余的压缩。

时间冗余_数据冗余类型

时间冗余

时间冗余常出现在序列图像和音频文件中。例如在电视和运动图像中,相邻帧之间可能会出现背景是相同的、仅有运动物体产生变化的情况,转化为储存数据时,去掉相邻帧之间的重复数据,就是去掉时间冗余数据。在音频中,会出现背景音不变、人的声音是连续渐变的情况,因此在储存这种类型的数据时,也会存在时间冗余。

结构冗余_数据冗余类型

结构冗余

结构冗余常出现在纹理结构较强的图片信息中,例如有规律的花纹图片,花纹结构几乎一致,这些结构一致的花纹信息表现出来的数据也是相同的,因此在储存时会出现结构冗余现象。

知识冗余_数据冗余类型

知识冗余

知识冗余常出现在与基础知识有较大相关性的图像数据中。许多图像显示的信息具有固定的结构,这些结构可以由较为普及的知识及前置学习经验获得,在储存时,这些信息转化为数据重复储存在数据库中,就可以称之为知识冗余。

视觉冗余_数据冗余类型

视觉冗余

视觉冗余是指超出人体器官感知阈值之外的信息。视觉冗余不仅指视觉感知,也包括听觉感知,例如,人体能听到的声音频率是 20Hz 到 2000Hz,在这个频率之外的声音是无法被感知的,这部分信息就称之为视觉冗余。因此在处理视觉冗余时,可以压缩这部分数据,储存的信息对人的感官来说不会有差别。

信息熵冗余_数据冗余类型

信息熵冗余

信息熵是指一组数据携带的平均信息量。在实际中,一组数据的实际储存大小要高于信息熵,两者之间的信息量差距就被称之为信息熵冗余,又被称为编码冗余。

数据冗余的影响

数据冗余造成的影响分为两类:

  • 一个是数据内容过多,会造成数据库储存空间的浪费。一般来说,在数据库设计之初就应该避免数据冗余的出现,数据库规范化就是为了防止冗余而且不浪费储存容量。
  • 二是冗余数据基本是同质化数据,冗余太多会影响数据访问和执行,降低储存及提取效率,还有可能导致数据的异常和损坏,影响数据交互效果。

增加数据冗余的目的

虽然数据冗余有一定的缺点,但在实际应用中,保存适量的数据冗余会加快查询速度,除此之外,保留或增加数据冗余的原因有以下几点:

  • 通过共同属性的数据冗余,建立数据之间的联系,可以应用于大数据索引。
  • 通过数据冗余恢复数据,防止数据丢失,一旦出现错误可以通过冗余数据找回原始数据。
  • 通过人为制造数据冗余简化处理流程,如在多个地点存放相同的信息,但不对其进行分析,从而减少工作量。

亚马逊云科技热门云产品

Amazon Glacier

Amazon Glacier

成本极低的存储服务,为数据存档和备份提供安全而持久的存储

Amazon S3

Amazon S3

专为可从任何位置检索任意数量的数据而构建的对象存储

Amazon Athena

Amazon Athena

立即开始查询数据。在几秒钟内获得结果,仅为您运行的查询付费

Amazon Lake Formation

Amazon Lake Formation

一项可让您在几天内轻松建立安全数据湖的服务

欢迎加入亚马逊云科技培训中心

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
  • 快速上手训练营
  • 第一课:亚马逊云科技简介

    本课程帮助您初步了解云平台与本地环境的差异,以及亚马逊云科技平台的基础设施和部分核心服务,包括亚马逊云科技平台上的弹性高可用架构,架构设计准则和本地架构迁移上云的基本知识。

    亚马逊云科技技术讲师:李锦鸿

    第二课:存储与数据库服务

    您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。

    亚马逊云科技资深技术讲师:周一川

    第三课:安全、身份和访问管理

    在这个模块,您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识,责任共担模型以及身份和访问管理服务, Identity and Access Management (IAM) 。同时,通过讲师演示,您将学会如何授权给 EC2 实例,允许其访问 S3 上的资源。

    亚马逊云科技技术讲师:马仲凯
  • 账单设置与查看
  • 视频:快速完成税务设置

    部署时间:5 分钟

    视频:账户账单信息

    部署时间:3 分钟

    视频:如何支付账单

    部署时间:3 分钟

  • 动手实操
  • 快速上手云上无服务器化的 MySQL 数据库

    本教程将引导您创建一个Aurora Serverless 数据库并且连接上它。

    部署时间:10 分钟

    启动一台基于 Graviton2 的 EC2 实例


    本教程将为您讲解如何在云控制台上启动一台基于 Graviton2 的 EC2 实例。

    部署时间:5 分钟

    使用 Amazon Systems Manager 进行云资源统一跟踪和管理

    在这个快速上手教程中,您将学会如何使用 Amazon Systems Manager 在 Amazon EC2 实例上远程运行命令。

    部署时间:10 分钟