数据冗余有哪些类型
数据冗余有哪些类型

空间冗余
空间冗余常出现在图像数据中。当某些像素的数据完全相同时,逐点储存就会产生空间数据冗余。为避免出现空间冗余,可对完全一致的像素数据进行压缩,相似度较高的数据也可以进行压缩,在数据恢复后图片与原图并不完全一致,但其中的区别人眼难以分辨,利用此种特性实现对空间冗余的压缩。

时间冗余
时间冗余常出现在序列图像和音频文件中。例如在电视和运动图像中,相邻帧之间可能会出现背景是相同的、仅有运动物体产生变化的情况,转化为储存数据时,去掉相邻帧之间的重复数据,就是去掉时间冗余数据。在音频中,会出现背景音不变、人的声音是连续渐变的情况,因此在储存这种类型的数据时,也会存在时间冗余。

结构冗余
结构冗余常出现在纹理结构较强的图片信息中,例如有规律的花纹图片,花纹结构几乎一致,这些结构一致的花纹信息表现出来的数据也是相同的,因此在储存时会出现结构冗余现象。

知识冗余
知识冗余常出现在与基础知识有较大相关性的图像数据中。许多图像显示的信息具有固定的结构,这些结构可以由较为普及的知识及前置学习经验获得,在储存时,这些信息转化为数据重复储存在数据库中,就可以称之为知识冗余。

视觉冗余
视觉冗余是指超出人体器官感知阈值之外的信息。视觉冗余不仅指视觉感知,也包括听觉感知,例如,人体能听到的声音频率是 20Hz 到 2000Hz,在这个频率之外的声音是无法被感知的,这部分信息就称之为视觉冗余。因此在处理视觉冗余时,可以压缩这部分数据,储存的信息对人的感官来说不会有差别。

信息熵冗余
信息熵是指一组数据携带的平均信息量。在实际中,一组数据的实际储存大小要高于信息熵,两者之间的信息量差距就被称之为信息熵冗余,又被称为编码冗余。

空间冗余
空间冗余常出现在图像数据中。当某些像素的数据完全相同时,逐点储存就会产生空间数据冗余。为避免出现空间冗余,可对完全一致的像素数据进行压缩,相似度较高的数据也可以进行压缩,在数据恢复后图片与原图并不完全一致,但其中的区别人眼难以分辨,利用此种特性实现对空间冗余的压缩。

时间冗余
时间冗余常出现在序列图像和音频文件中。例如在电视和运动图像中,相邻帧之间可能会出现背景是相同的、仅有运动物体产生变化的情况,转化为储存数据时,去掉相邻帧之间的重复数据,就是去掉时间冗余数据。在音频中,会出现背景音不变、人的声音是连续渐变的情况,因此在储存这种类型的数据时,也会存在时间冗余。

结构冗余
结构冗余常出现在纹理结构较强的图片信息中,例如有规律的花纹图片,花纹结构几乎一致,这些结构一致的花纹信息表现出来的数据也是相同的,因此在储存时会出现结构冗余现象。

知识冗余
知识冗余常出现在与基础知识有较大相关性的图像数据中。许多图像显示的信息具有固定的结构,这些结构可以由较为普及的知识及前置学习经验获得,在储存时,这些信息转化为数据重复储存在数据库中,就可以称之为知识冗余。

视觉冗余
视觉冗余是指超出人体器官感知阈值之外的信息。视觉冗余不仅指视觉感知,也包括听觉感知,例如,人体能听到的声音频率是 20Hz 到 2000Hz,在这个频率之外的声音是无法被感知的,这部分信息就称之为视觉冗余。因此在处理视觉冗余时,可以压缩这部分数据,储存的信息对人的感官来说不会有差别。

信息熵冗余
信息熵是指一组数据携带的平均信息量。在实际中,一组数据的实际储存大小要高于信息熵,两者之间的信息量差距就被称之为信息熵冗余,又被称为编码冗余。
数据冗余的影响
数据冗余的影响
数据冗余造成的影响分为两类:
一个是数据内容过多,会造成数据库储存空间的浪费。一般来说,在数据库设计之初就应该避免数据冗余的出现,数据库规范化就是为了防止冗余而且不浪费储存容量。
二是冗余数据基本是同质化数据,冗余太多会影响数据访问和执行,降低储存及提取效率,还有可能导致数据的异常和损坏,影响数据交互效果。
增加数据冗余的目的
增加数据冗余的目的
虽然数据冗余有一定的缺点,但在实际应用中,保存适量的数据冗余会加快查询速度,除此之外,保留或增加数据冗余的原因有以下几点:
1.通过共同属性的数据冗余,建立数据之间的联系,可以应用于大数据索引。
2.通过数据冗余恢复数据,防止数据丢失,一旦出现错误可以通过冗余数据找回原始数据。
3.通过人为制造数据冗余简化处理流程,如在多个地点存放相同的信息,但不对其进行分析,从而减少工作量。
亚马逊云科技数据冗余相关产品
亚马逊云科技数据冗余相关产品
新用户注册,可免费体验 12 个月