数据仓库表命名规范

俗话说无规矩不成方圆。我们在搭建数据平台的时候,需要先制定好各种规范,越早越好,并且不断的监督大家是否按照约定执行。一旦大家自由发挥,想要再次统一或者重构就非常的困难,会浪费很大的人力成本和时间成本,因此在这里总结一下数据仓库的表命名规范。
一般来说表名需要见名知意,通过表名就可以知道它是哪个业务域,干嘛用的,什么粒度的数据。特殊用途的表有一些特殊的命名法则。

1、常规表

常规表是我们需要固化的表,是正式使用的表,是需要去维护去完善的表。

规范:分层前缀[ods|dwd|dws|ads]-业务域-主题域-XXX-粒度

业务域、主题域我们都可以用词根的方式枚举清楚,不断完善,粒度也是同样的,主要的是时间粒度、日、月、年、周等,使用词根定义好简称。

2、临时表

临时表是不需要固化的表,是临时使用一次的表,就是暂时保存下数据看看,后续一般不再使用,是可以随时删除的表。

规范:tmp-XXX

只要加上tmp开头即可,其他名字随意,注意tmp开头的表不要用来实际使用,只是测试验证而已。

3、维表

维表是稳定不变或者变化非常缓慢的表,例如销售渠道维表、商品维表等,可以从数据中自动生成也可以手工来维护。

规范:dim-XXX

维表,统一以dim开头,后面加上,对该指标的描述,可以自由发挥。

4、手工表

手工表是手工维护的表,手工初始化一次之后,一般不会自动改变,后面变更也是手工来维护。一般来说,手工的数据粒度是偏细的,所以,暂时统一放在dwd层,后面如果有目标值或者其他类型手工数据,再根据实际情况分层。

规范:dwd-业务域-manual-XXX

名称中的manual表示这是手工维护表。