元数据,一个简单的定义是描述数据的数据。在企业中,无论哪里有数据,都有相应的元数据。只有存在完整而准确的元数据,我们才能更好地理解数据并充分利用数据的价值。为了让大家更好地了解什么是元数据,亿信华辰小编针对元数据的类型,举例说明什么是元数据。
元数据分类及举例说明
一、技术元数据
1.物理元数据描述物理资源的元数据,例如:服务器,操作系统,计算机机房位置和其他信息。
2.数据源元数据描述了数据源的元数据,通常包括四种类型的信息:
数据源地址(例如IP,PORT等)
物理拓扑(例如主备,角色等)
权限(例如用户名,密码等)
以及库名称,版本,域名等
3.存储元数据描述对象存储的元数据,通常也是“狭义”的元数据,包括几种主要类型的管理属性(例如创建者,应用系统,业务部门,业务负责人等)
生命周期(例如创建时间,DDL时间,版本信息等)
存储属性(例如位置,物理大小等)
数据特征(例如数据偏斜,平均长度等)
使用特征(例如DML,刷新)速率等)
数据结构表/分区(例如名称,类型,备注等)
列(例如名称,类型,长度,精度等)
索引(例如名称,类型,字段等)
约束(例如类型,字段等)
4.计算元数据描述数据计算过程的元数据通常可以分为两种类型的计算:数据提取(ETL)或数据处理(JOB)。每种类型的计算都可以进一步细分控制元数据(例如配置属性,调度策略等)和过程元数据(例如依赖项,执行状态,执行日志等)。
5.质量元数据是一种描述数据质量的元数据。通常,数据质量是通过定义一系列质量指标来反映的。
6.操作元数据,描述了如何将数据用于操作的一类元数据。
数据生成(例如生成时间,作业信息等)
表访问(例如查询,关联,聚合等)
表关联(例如关联表,关联字段,关联类型,关联数)
字段访问(例如查询,关联,聚合,过滤等))
7.操作和维护元数据描述了系统的操作和维护级别的元数据,通常包括任务,警报和故障。
8.成本元数据描述数据存储和计算成本的元数据。
计算成本(例如,CPU,MEM等)
存储成本(例如,空间,压缩率等)
9.标准元数据描述了数据标准化内容的元数据。
代码管理(例如转换规则,外部接口等)
映射管理数据显示(例如样式,规则,语义,单位等)
10.安全性元数据描述数据安全性内容的元数据。
安全级别数据敏感度(例如,是否敏感,脱敏算法等)
11.共享元数据描述了如何共享数据,例如接口方法,格式和内容。
二、业务元数据
1.模型元数据数据建模是对业务的描述,可以通过模型更好地理解业务。常见的建模方法包括范式模型,维模型和多维建模。下面以尺寸模型为例。例如业务线、板块、过程数据域、主题域维度、属性索引事实、度量市场与应用。
2.应用元数据指描述了数据应用类的元数据。
3.分析元数据是指从数据分析的角度描述业务元数据。例如数据域、主题域产品线、板块、业务过程、业务流程、业务规则等。
三、管理元数据
管理元数据描述了企业内部数据管理的内容,例如人员流程职责,职务组织和部门。