ETL开发实施中质量保证的关键步骤 |
| |
引用本文: | 郑承满,石爱华,刘宏吉. ETL开发实施中质量保证的关键步骤[J]. 中国金融电脑, 2006, 0(1): 60-62 |
| |
作者姓名: | 郑承满 石爱华 刘宏吉 |
| |
作者单位: | 中国建设银行信息技术管理部厦门开发中心 |
| |
摘 要: | 数据仓库项目实施成败的关键因素之一就是数据抽取过程中数据的质量问题。在数据仓库建设过程中,我们不得不在原有的数据中“艰难跋涉”,这些数据来自原有数据库、原有磁带机以及远程的数据源,它们中的大部分都凌乱不堪,并且难以获取。我们要对这些数据进行大量处理,并且还要通过ETL(Extract,Transform Band Load)程序来寻找其中的有用信息。这就要求开发人员必须花费足够的时间来充分研究这些数据,将凌乱的数据规则化,并尽力设计和实现强壮的数据采集和转换过程。如果没有对源数据进行整理和数据标准化等基础工作,很可能造成数据仓库项目的基础不牢。
|
关 键 词: | 质量保证 开发 ETL 数据仓库项目 数据标准化 质量问题 数据抽取 项目实施 仓库建设 转换过程 |
The key step of quality assurance in ETL development implementation |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |