【TechTarget中国原创】数据仓储开始并不产生许多个数据仓库,但经常发生这样的事情。栏目嘉宾Rick Sherman表示,主要问题就是数据仓储经常被人们误解。
20年前人们首次创造了“数据仓储”这一术语。从那以后,Fortune 1000家公司的主流活动都会涉及到这个词,因为在后来的十多年中这些公司的数据仓储的项目有很多。但是20年后的市场上,数据仓储仍然被人们误解。
Rick Sherman, Athena IT解决方案
数据仓储的目标就是创造“真相版本之一”。但是在这些努力的过程中,许多公司常常就是用复制数据仓库代替。以下是一些典型的例子:
公司在数据仓储伞上安装一个多余的数据库——它们之中有一些是矛盾的或者互不相容的。2004年的数据仓储研究调查表明,“平均每个公司有2个数据仓库、6个独立的数据集市、4.5个操作型数据存储以及28.5个Spreadmarts。”
公司在ERP报告和商业智能(BI)方面仍然要从组织上以及技术上努力。尽管ERP厂商有数据仓储并且已经建立了数据仓储模块,他们也仍需要在上述方面做出努力。遗憾的是,这些模块通常是在公司已建立的公共的数据仓储模块上面独个安装的。
公司性能管理机构(CPM)给出了一个企业安装全面的、和谐一致的数据仓储的十分完美的理由。然而,CPM程序经常让BI厂商先安装了一个解决方案,如同上述的ERP厂商将公司共有的数据仓库分开。这种方法产生了段期、快速的商业利润。在段时间内这种方法还可以,但是从长远来看,它仅仅是扩大了数据仓库和数据之间的矛盾。
公司数据仓储产生了更多的数据仓库并不是说数据仓储无从选择,它可能意味着人们完全不懂或者不能获得如何在公司范围内正确实行数据仓储的产品。
为什么在数据仓储的目标和公司实际安装的数据库的现实之间还存在着这么大的差距?大多数人都不清楚。
人们常把“数据仓库”和“数据仓储”两者混淆。数据仓储不仅仅包含数据仓库,它还包含一个完整的结构和步骤。数据仓储就是将数据转换成为信息,通过这种方式来检验它的操作和性能。这一任务将通过将数据源升级以及数据转换来完成并获取、分析信息。数据存储的时间将会持久(在磁盘上保存)或者短暂(用磁盘或存储器)。此外,工作流程通常包括多个数据存储到支持升级和数据转换到信息,如操作型数据存储、数据仓库、数据集市、在线分析处理体、文档如flat file ( 用都好隔开的函数值)XML数据和电子表。
只要你从操作系统中获取数据并执行报告和分析的任务,那你就在实施数据仓储的过程。过去人们把它叫做决策支持,现在的术语就是商业智能。数据仓储的对象就是BI的曲线图和枢轴之下的数据。事实上,BI仅仅是数据仓储架构上的表述层。
数据仓储通常只和数据仓库而不是整个架构和步骤联系在一起。数据质量、连贯性和完整性——更不用说能审计数据——只有在考虑到整个数据升级(或数据仓储)架构时才可能实现。
数据仓储程序比数据仓库要多得多。稍微看一下DW, 单独的ERP、CPM以及BI重建了DW的架构以及他们自己的数据仓库。从观念上说来,架构全景对相互之间的工作、重新使用的工具、密码、步骤、数据和标准起到了平衡作用。一个公司能够以更高的ROI、更低的全面操作和维护费用,很经济地安装这些系统、但是他们仍然要为“真相的唯一版本”而努力。