理论教育 信息分析导论:核心概念与多维数组

信息分析导论:核心概念与多维数组

时间:2023-10-30 理论教育 版权反馈
【摘要】:一般情况下,维具有层次性,可以进一步分解或聚类。维的一个取值称为该维的一个维成员。多维数组是OLAP的核心,又称立方体或超立方。多维数组是由一组维和度量组成的,可以用一个多维数组来表示:(维1,维2,…例如,按时间、地区、职称类型组织起来的教师数量多维数据集可以表示为:,如图6.3所示。当在多维数组中的每个维上都选中一个维成员以后,这些维成员的组合就唯一确定了度量值。

信息分析导论:核心概念与多维数组

一些常用术语在OLAP领域中具有特殊含义,信息分析师需要掌握这些术语之间的区别与联系。

(1)变量

变量是数据的实际意义,它主要描述数据“是什么”。例如“人数”“单价”“销售量”等都是变量。

(2)维。

维是人们观察数据的特定角度,如时间维、地理维等。一般情况下,维具有层次性,可以进一步分解或聚类。如:日期、月份、季度、年等是时间维的层次;城市、地区、国家等是地理维层次。

维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么该维的维成员是在不同维层次的取值的组合。如时间维具有日期、月份、年这三个层次,因此需要分别在日期、月份、年上各取一个值组合起来——时间维的一个维成员,例如“2019年9月11日”。(www.daowen.com)

(3)多维数组

多维数组是OLAP的核心,又称立方体或超立方。多维数组是由一组维和度量组成的,可以用一个多维数组来表示:(维1,维2,…,维n,度量)。例如,按时间、地区、职称类型组织起来的教师数量多维数据集可以表示为:(时间,地区,职称类型,教师数量),如图6.3所示。

(4)数据单元

多维数组的取值为数据单元。当在多维数组中的每个维上都选中一个维成员以后,这些维成员的组合就唯一确定了度量值。数据单元可表示为:(维1成员,维2成员,…,维n成员,变量值)。例如,在图6.3中时间、地区和职称类型维上分别选取维成员“2018年”“北京”“教授”,则可以唯一确定观察度量“教师数量”的一个取值30000位,这样该数据单元可表示为:(2018年,北京,教授,30000)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈