数据字典标准与统一的重要性(码表&枚举值)

在日常的软件开发当中,开发者经常会听到“公共代码、编码、码表、枚举值”这样的名词,对这些概念可能会有些混淆和认知不透彻,那么这篇文章会详细论述一下关于数据字典的相关概念、应用、标准与统一的重要性及其数据来源。

关于“公共代码、编码、码表、枚举值”的含义,其本质都可以统一为码表,是对某一领域事务或概念的一定范围的划分,有相对固定的取值边界。其最基本的结构就是键值对,一般由中英文名称编码组成,由可枚举数据构成,存储枚举数据名称与编码的映射关系,由key和value组成。

码表可用于标准属性值取值范围的约束。标准代码是数据标准的取值范围,在标准代码中可设置某一数据标准可选择的数据的内容以及范围。例如性别数据标准的标准代码内容应该为男或女。

数据字典的用途一般体现在软件开发和数据统计这两个方面:

在软件开发方面,一般在后台管理系统会单独设置一个页面用来管理数据字典,包括数据字典的添加、删除、修改、查询等功能,对数据字典列表进行维护。在软件的前台页面用的地方就比较常见了,数据字典的数据主要用“下拉框”这种控件来体现,主要用来展示码表选项;

图1

在数据统计方面,数据字典一般不是用来展示的,而是用于SQL中select查询的group by分组统计,也就是根据不同“维度或分组”对事实数据进行分组统计,最后形成一定的报表数据,供管理者决策分析。如下图的枚举值“性别sex”:

图2

在实际应用中,数据字典的标准化与统一化尤为重要,其重要性重要体现在两个方面:

u 本系统内的标准化:数据字典的标准化在系统内部是非常重要的,数据字典的标准化为后续的软件开发和数据统计提供了数据基础,同时增强了系统的可理解性和易操作性;

u 系统之间的统一化:一般比较大一些的公司,内部会有很多软件系统,系统之间的数据交换是非常普遍的事情,如果系统间的数据字典不一致,就会造成数据不统一,在统计数据时,技术口径和业务口径很容易冲突,失去了系统间数据交换的目的。

因此,数据字典数据的标准化和统一化是非常重要的,那么不同行业领域的标准的数据字典从哪里获取呢,这里推荐一个比较专业的数据字典数据源“昂焱数据”(www.ayshuju.com)网站,截图如下:

图3

该网站将数据字典数据按照不同行业领域划分为12大类,每一个大类都有专业丰富的码表数据,这些数据都是行业规范或国家标准,在公司统一使用这些数据,可以达到公司内部数据与外部数据的标准与统一。