联机分析处理的相关基本概念
联机分析处理的相关基本概念
度量
度量是用来描述数据实际含义的一组值,通常为数字值。它是从现实系统中抽象出来的,是最终分析者查看结果时重点关注的数值。比如库存数量、成本金额、某个月份等。
维
维是分析员观察度量值的角度,当有大量数据与度量值有关系时,我们需要考虑和观察它内部的联系。比如,当我们分析某一类商品全年的“销售金额”这个度量值时,可以从“地区维”观察销售量与该地区的关系,也能从“时间维”分析该商品销售量与时间的关系。
维的层次性
在分析多维数据时,对度量值也可以在不同细致程度上进行分析。例如,一个“时间维”的层次可以是日、月、季、年,一个“商品维”的层次可以是家电类、美妆类、服饰类、清洁类等。还可以按照价格、消费人群划分。
维的成员和多维数组
维的成员是维的一个取值,比如,对具有洲、国家、省、市四个层次的“地区维”来说,“亚洲中国江苏省苏州市”就是其中的一个维成员。一个多维数组的表示形式为(维1, 维2, …, 维n, 度量值),例如,一个关于商品销售的三维数组是(时间、地区、种类,销售额),那它的一个数据成员就可以为:(2022年9月,深圳市,电热毯,200万)。
度量
度量是用来描述数据实际含义的一组值,通常为数字值。它是从现实系统中抽象出来的,是最终分析者查看结果时重点关注的数值。比如库存数量、成本金额、某个月份等。
维
维是分析员观察度量值的角度,当有大量数据与度量值有关系时,我们需要考虑和观察它内部的联系。比如,当我们分析某一类商品全年的“销售金额”这个度量值时,可以从“地区维”观察销售量与该地区的关系,也能从“时间维”分析该商品销售量与时间的关系。
维的层次性
在分析多维数据时,对度量值也可以在不同细致程度上进行分析。例如,一个“时间维”的层次可以是日、月、季、年,一个“商品维”的层次可以是家电类、美妆类、服饰类、清洁类等。还可以按照价格、消费人群划分。
维的成员和多维数组
维的成员是维的一个取值,比如,对具有洲、国家、省、市四个层次的“地区维”来说,“亚洲中国江苏省苏州市”就是其中的一个维成员。一个多维数组的表示形式为(维1, 维2, …, 维n, 度量值),例如,一个关于商品销售的三维数组是(时间、地区、种类,销售额),那它的一个数据成员就可以为:(2022年9月,深圳市,电热毯,200万)。
联机分析处理的基本多维分析方法
联机分析处理的基本多维分析方法
切片与切块
将多维数据的某一个维选定进行统计分析叫做切片,限制多维数据某一维的取值区间叫做切块。例如,多维数组(时间,地区,产品,销售额),其地区维上的一个切片可以是(时间,深圳,产品,销售额),时间维的一个切块是(2022年1月至2022年9月,地区,产品,销售额)。
钻取
钻取分为下钻和上卷,下钻是指将汇总数据新增维度,进一步细分去分析数据。上卷是下钻的逆操作,上卷将某一维上的细分数据减少维度,方便分析员看到更为综合的数据。
旋转
只改变维度的位置次序,不对数据的精度有任何改变,方便分析员从多个角度了解信息。
切片与切块
将多维数据的某一个维选定进行统计分析叫做切片,限制多维数据某一维的取值区间叫做切块。例如,多维数组(时间,地区,产品,销售额),其地区维上的一个切片可以是(时间,深圳,产品,销售额),时间维的一个切块是(2022年1月至2022年9月,地区,产品,销售额)。
钻取
钻取分为下钻和上卷,下钻是指将汇总数据新增维度,进一步细分去分析数据。上卷是下钻的逆操作,上卷将某一维上的细分数据减少维度,方便分析员看到更为综合的数据。
旋转
只改变维度的位置次序,不对数据的精度有任何改变,方便分析员从多个角度了解信息。