7.3.1 数据维度

7.3.1 数据维度

从广义上讲,维度是与事物“有联系”的概念的数量,根据“有联系”的概念的数量,事物可分为不同的维度。例如:与线有联系的概念有长度,则线为一维事物;与长方形面积有联系的概念有长度和宽度,则长方形面积为二维事物;与长方体体积有联系的概念有长度、宽度、高度,则长方体体积为三维事物。

相应的,数据也有维度,那数据的维度有哪些呢?

计算机是能够根据指令操作数据的设备,因此操作数据是程序最重要的任务。除了单一数据类型(数字、浮点数等),更多的数据需要根据不同维度组织起来,以便进行管理和程序处理。根据组织数据时与数据“有联系”的参数的数量,数据维度可以分为一维数据、二维数据和高维数据。

一维数据是由具有对等关系的有序或无序数据构成的,采用线性方式组织,对应数学中的集合和一维数组。在Python语法中,一维列表、一维元组和集合都是一维数据。一维数据的各个元素可用逗号、空格等分隔。如国际经济合作主要论坛二十国集团(G20)的成员就是一条一维数据,可表示为:

中国,美国,日本,德国,法国,英国,意大利,加拿大,俄罗斯,欧盟,澳大利亚,南非,阿根廷,巴西,印度,印度尼西亚,墨西哥,沙特阿拉伯,土耳其,韩国

二维数据关系的参数数量为2,也称为表格数据,对应数学中的矩阵、表格。在Python语法中,二维列表、二维元组都是二维数组,如存储学生信息的表格(表7-5)。

表7-5 学生信息

高维数据采用键值对等简单的二元关系展示数据间的复杂结构,以对象方式组织,属于较好的数据组织方式。高维数据在网络中经常用到,如HTML、XML、JSON等都是高维数据。Python中字典类型的数据是高维数据。如学生的成绩信息用字典表示: