首页  云计算知识 
数据冗余

什么是数据冗余?

数据冗余是出现在数据库系统里的一种现象,是指在数据库中同一个字段的数据重复出现。数据冗余可能会造成数据库异常或数据破坏,也会浪费数据库资源,因此在设计上应该尽量避免。但在实际应用时,会保留甚至刻意增加数据冗余以实现某些功能,例如数据间建立联系、数据恢复和数据核查等。

新用户享受中国区域 12 个月免费套餐

什么是数据冗余
首页  云计算知识 
数据冗余
什么是数据冗余

什么是数据冗余?

数据冗余是出现在数据库系统里的一种现象,是指在数据库中同一个字段的数据重复出现。数据冗余可能会造成数据库异常或数据破坏,也会浪费数据库资源,因此在设计上应该尽量避免。但在实际应用时,会保留甚至刻意增加数据冗余以实现某些功能,例如数据间建立联系、数据恢复和数据核查等。

新用户享受中国区域 12 个月免费套餐

数据冗余有哪些类型

数据冗余有哪些类型

空间冗余_数据冗余类型

空间冗余

空间冗余常出现在图像数据中。当某些像素的数据完全相同时,逐点储存就会产生空间数据冗余。为避免出现空间冗余,可对完全一致的像素数据进行压缩,相似度较高的数据也可以进行压缩,在数据恢复后图片与原图并不完全一致,但其中的区别人眼难以分辨,利用此种特性实现对空间冗余的压缩。

时间冗余_数据冗余类型

时间冗余

时间冗余常出现在序列图像和音频文件中。例如在电视和运动图像中,相邻帧之间可能会出现背景是相同的、仅有运动物体产生变化的情况,转化为储存数据时,去掉相邻帧之间的重复数据,就是去掉时间冗余数据。在音频中,会出现背景音不变、人的声音是连续渐变的情况,因此在储存这种类型的数据时,也会存在时间冗余。

结构冗余_数据冗余类型

结构冗余

结构冗余常出现在纹理结构较强的图片信息中,例如有规律的花纹图片,花纹结构几乎一致,这些结构一致的花纹信息表现出来的数据也是相同的,因此在储存时会出现结构冗余现象。

知识冗余_数据冗余类型

知识冗余

知识冗余常出现在与基础知识有较大相关性的图像数据中。许多图像显示的信息具有固定的结构,这些结构可以由较为普及的知识及前置学习经验获得,在储存时,这些信息转化为数据重复储存在数据库中,就可以称之为知识冗余。

视觉冗余_数据冗余类型

视觉冗余

视觉冗余是指超出人体器官感知阈值之外的信息。视觉冗余不仅指视觉感知,也包括听觉感知,例如,人体能听到的声音频率是 20Hz 到 2000Hz,在这个频率之外的声音是无法被感知的,这部分信息就称之为视觉冗余。因此在处理视觉冗余时,可以压缩这部分数据,储存的信息对人的感官来说不会有差别。

信息熵冗余_数据冗余类型

信息熵冗余

信息熵是指一组数据携带的平均信息量。在实际中,一组数据的实际储存大小要高于信息熵,两者之间的信息量差距就被称之为信息熵冗余,又被称为编码冗余。

空间冗余_数据冗余类型

空间冗余

空间冗余常出现在图像数据中。当某些像素的数据完全相同时,逐点储存就会产生空间数据冗余。为避免出现空间冗余,可对完全一致的像素数据进行压缩,相似度较高的数据也可以进行压缩,在数据恢复后图片与原图并不完全一致,但其中的区别人眼难以分辨,利用此种特性实现对空间冗余的压缩。

时间冗余_数据冗余类型

时间冗余

时间冗余常出现在序列图像和音频文件中。例如在电视和运动图像中,相邻帧之间可能会出现背景是相同的、仅有运动物体产生变化的情况,转化为储存数据时,去掉相邻帧之间的重复数据,就是去掉时间冗余数据。在音频中,会出现背景音不变、人的声音是连续渐变的情况,因此在储存这种类型的数据时,也会存在时间冗余。

结构冗余_数据冗余类型

结构冗余

结构冗余常出现在纹理结构较强的图片信息中,例如有规律的花纹图片,花纹结构几乎一致,这些结构一致的花纹信息表现出来的数据也是相同的,因此在储存时会出现结构冗余现象。

知识冗余_数据冗余类型

知识冗余

知识冗余常出现在与基础知识有较大相关性的图像数据中。许多图像显示的信息具有固定的结构,这些结构可以由较为普及的知识及前置学习经验获得,在储存时,这些信息转化为数据重复储存在数据库中,就可以称之为知识冗余。

视觉冗余_数据冗余类型

视觉冗余

视觉冗余是指超出人体器官感知阈值之外的信息。视觉冗余不仅指视觉感知,也包括听觉感知,例如,人体能听到的声音频率是 20Hz 到 2000Hz,在这个频率之外的声音是无法被感知的,这部分信息就称之为视觉冗余。因此在处理视觉冗余时,可以压缩这部分数据,储存的信息对人的感官来说不会有差别。

信息熵冗余_数据冗余类型

信息熵冗余

信息熵是指一组数据携带的平均信息量。在实际中,一组数据的实际储存大小要高于信息熵,两者之间的信息量差距就被称之为信息熵冗余,又被称为编码冗余。

数据冗余的影响

数据冗余的影响

数据冗余造成的影响分为两类:

一个是数据内容过多,会造成数据库储存空间的浪费。一般来说,在数据库设计之初就应该避免数据冗余的出现,数据库规范化就是为了防止冗余而且不浪费储存容量。

二是冗余数据基本是同质化数据,冗余太多会影响数据访问和执行,降低储存及提取效率,还有可能导致数据的异常和损坏,影响数据交互效果。

增加数据冗余的目的

增加数据冗余的目的

虽然数据冗余有一定的缺点,但在实际应用中,保存适量的数据冗余会加快查询速度,除此之外,保留或增加数据冗余的原因有以下几点:
1.通过共同属性的数据冗余,建立数据之间的联系,可以应用于大数据索引。
2.通过数据冗余恢复数据,防止数据丢失,一旦出现错误可以通过冗余数据找回原始数据。
3.通过人为制造数据冗余简化处理流程,如在多个地点存放相同的信息,但不对其进行分析,从而减少工作量。

亚马逊云科技数据冗余相关产品

亚马逊云科技数据冗余相关产品

Amazon Glacier

Amazon Glacier

成本极低的存储服务,为数据存档和备份提供安全而持久的存储

Amazon S3

Amazon S3

专为可从任何位置检索任意数量的数据而构建的对象存储

Amazon Athena

Amazon Athena

立即开始查询数据。在几秒钟内获得结果,仅为您运行的查询付费

Amazon Lake Formation

Amazon Lake Formation

一项可让您在几天内轻松建立安全数据湖的服务

准备好免费体验亚马逊云科技相关数据冗余产品了吗?
准备好免费体验亚马逊云科技相关数据冗余产品了吗?

新用户注册,可免费体验 12 个月

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程

欢迎加入亚马逊云科技培训中心

从 0 到 1 轻松上手云服务,获取更多
官方开发资源及培训教程

关闭 在线实时聊天

与云计算专家聊天,回答您的问题

通过热线与我们联系

1010 0766 由光环新网运营的亚马逊云科技中国(北京)区域
1010 0966 由西云数据运营的亚马逊云科技中国(宁夏)区域

联系销售人员

联系亚马逊云科技专家以了解有关亚马逊云科技的更多信息

关闭 在线实时聊天

与云计算专家聊天,回答您的问题

通过热线与我们联系

1010 0766 由光环新网运营的亚马逊云科技中国(北京)区域
1010 0966 由西云数据运营的亚马逊云科技中国(宁夏)区域

联系销售人员

联系亚马逊云科技专家以了解有关亚马逊云科技的更多信息