本教程操作环境:windows10系统、Dell G3电脑。
ETL(Extract-Transform-Load,数据仓库技术),是将业务系统的数据经过抽取(extract)、清洗转换(transform)之后加载(load)到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。
数据仓库各层说明:
1、数据加载层:ETL(Extract-Transform-Load)
2、数据运营层:ODS(Operational Data Store)
3、数据仓库层:DW(Data Warehouse)
-
数据明细层:DWD(Data Warehouse Detail)
-
数据中间层:DWM(Data WareHouse Middle)
-
数据服务层:DWS(Data WareHouse Service)
4、数据应用层:APP(Application)
5、维表层:DIM(Dimension)
分层好处:
-
清晰数据结构:每一个数据分层都有它的作用域和职责,在使用表的时候能更方便地定位和理解
-
减少重复开发:规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算
-
统一数据口径:通过数据分层,提供统一的数据出口,统一对外输出的数据口径
-
复杂问题简单化:将复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。当数据出现问题之后,不用修复所有的数据,只需要从有问题的步骤开始修复。
-
屏蔽原始数据的异常:不必改一次业务就需要重新接入数据。
更多相关知识,请访问常见问题栏目!
以上就是对数据进行etl加工的数据层是什么的详细内容,更多请关注亿码酷站其它相关文章!
对数据进行etl加工的数据层是什么
—–文章转载自PHP中文网如有侵权请联系ymkuzhan@126.com删除
本文永久链接地址:https://www.ymkuzhan.com/33107.html