在这部分将按照设计和实现ETL系统的流程展开,将上一个部分的那些子系统按照提取数据、清洗和一致化、向呈现服务器提交以及管理ETL环境等四个方面进行了分类。(是不是说对ETL主要就是掌握这四个方面的内容)
ETL处理步骤 | 提取数据 | 清洗和一致化 | 向呈现层提交 | 管理ETL环境 |
计划 | ||||
创建一个高层的、单页的源到目标示意流程 | * | |||
测试、选择和实现一种ETL工具 | ||||
为维度管理、错误处理和其他有关过程设计默认的策略 | * | * | * | |
通过目标表向下钻取,给出任何复杂数据重组或转换的图形示意,并且设计初步的作业序列 | * | * | * | |
设计一次性历史装载过程 | ||||
建立和测试历史事实表的装载,包括代理键的查询和替换 | * | * | * | |
设计增量装载过程 | ||||
建立和测试维度表增量装载过程 | * | * | * | |
建立和测试事实表增量装载过程 | * | * | * | |
建立和测试聚集表装载和OLAP处理 | * | |||
设计、建立和测试ETL系统的自动化 | * | * | * |