RSS订阅
RSS订阅TT数据库

数据仓库灾难恢复101

2008-8-18  选择字号:  | |
打印本文章

导读:数据仓库已经成为紧急任务系统,它能帮助行政人员进行日常决策。在这个月的专栏里,BI专家Wayne Eckerson就如何有效地保护你的数据仓库提出了具体建议。

关键词:Oracle Oracle数据仓库 灾难恢复 数据仓库灾难恢复

正在加载数据...

【TechTarget中国原创】数据仓库已经成为紧急任务系统,它能帮助行政人员进行日常决策。在这个月的专栏里,BI专家Wayne Eckerson就如何有效地保护你的数据仓库提出了具体建议。

  你最后一次回顾和测试数据仓库灾难恢复计划是在什么时候?你有数据仓库灾难恢复计划吗?虽然自然和地理政治概念上的灾难——包括龙卷风、雷暴天气以及油价上涨——正逐步增多,他们还不是你商业智能环境(BI)的最大的威胁。据Information Age调查,英国某主要的准们为主管编辑的杂志表示大多数的IT行政人员都相信对IT操作持续性的造成最大威胁是内部系统故障(65%)和病毒(45%)。同时,自然灾难占32% 能量和运输损耗占33%。

  时代变了

  十年前根本就没有必要为数据仓库制定恢复计划、报表和它们支持的应用程序。当时,绝大多数数据仓库每月都被装在半打或者开源系统上。大多数负载量都很小,即使是最大的数据仓库都比一些兆字节大小要小得多。所以大多数数据仓储团队都没有灾难恢复计划一点都不感到奇怪,更不用说备份策略了。一般来说如果数据仓库被损坏,你可以简单对它整体做一下更新。

  今天,大多数数据仓库已经成为了紧急任务执行系统。一些数据仓库在实时的基础上捕捉业务并对它进行了更新,并且这些数据仓库支持许多业务运营应用程序。如果系统脱机几个小时的话。业务运营程序用户就对制定日常决策的数据仓储信息非常依赖所以这些程序对数据仓储主管的要求也特别苛刻。再者,作为决策程序,数据仓库可以在灾难发生时帮助企业或机构作出最理想的反应。数据仓库报表能够帮助行政人员解决如何区分活动顺序、进行资源配置以及分配人员处理紧急事务。

  你的公司将操作所需的业务过程和应用程序区分开了么?如果数据仓库应予以有先考虑的话,那么数据抽取、转换和装载过程(ETL)呢?ETL可以组装数据仓库以及绘制、分发报表的BI服务器。这条链很脆弱,数据仓库环境很复杂,包含多个系统和应用程序、并且和内部、外部系统相互依赖,所以数据仓库的环境不能在它所有元件都联机之前完全恢复。

  你最后一次真正测试数据仓库恢复计划是什么时候?如果你在数据库故障中测试恢复,那你还只完成了一部分。你还需要恢复客户、服务器、网络、存储、应用程序和数据库,对恢复环境进行完全模拟。如果你是在一年之前进行的测试,那这就是测试你的恢复计划是否过期的好机会。由于数据仓库是个能更新的系统,所以它会经常回答业务人员提出的新问题。因此查询、报表、元数据、ETL workflow等也许从你上次测试开始就已经改变了。再次,业务人员在这种紧急情况下问的问题和他们在平时问得问题可能会完全不一样。

  快速恢复的关键不仅仅是灵活多余的系统的,还有人。在灾难发生的过程中一定很混乱。许多主要的人员也许不在或不能登陆操作系统。因此你不仅需要系统的冗余量而且还需要进行分配。你的团队应该锻炼具备适应各种紧急情况的能力并且还要准备扮演多个角色。

  准备

  灾难恢复重视质量好、最新的、端到端的元数据,一些公司已经成功安装了这些数据。元数据至关重要的,它影响评估——当一些数据在开元系统里发生变化时,你要知道它将怎样在终端用户的报表里影响系统里的其它元件。在紧急情况下,数据仓储团队的能力可能会受到影响,达不到恢复时间的目标(如恢复业务功能)、危急数据点(需要及时恢复数据的点)以及恢复点对象(恢复数据的时间)而不需要登录动态综合元数据管理系统。
 
  数据当然是数据仓储环境的心腹,所以企业必须确保数据不会出现能量故障、储运损耗或其它灾难。许多企业都作了低成本的磁带备份并且进行运距离储运。虽然从磁带中恢复数据仓库要花很长的时间,这些数据都是历史性并且在紧急情况中没有很高的价值。为了保护更多更新的信息,公司还应该在数据通过ETL过程中对数据进行进行复制和快照然后把它们储存在灾难恢复系统里的磁盘上,这种方法能在一段时间(通常是几天或几周)后将数据存档或删除。大多数数据仓储团队都了解处理数据仓储信息的生命周期的必要性。

  遗憾的是,这些团队通常不参加两次灾难恢复。最理想的状态就是,联机备份系统远距离保存,因此数据中心并不能同时破坏原来的系统以及备份的系统(这样做的费用明显要高得多并需要高速网络连接)。如果远程系统出现故障,他们同样没有对备份文件进行备份。许多企业没有预料到灾难会持续许多天。如果在Katrina的激发下一些业务仍然不能完全恢复,我们就需要延长对灾难预计的时间。最后,许多远程备份系统不能保护公司免遭病毒攻击,而且这些病毒还在系统内部进行繁殖。远程系统应该有一扇内置门,这扇门能将真正的病毒繁殖时间能的延长几个小时从而保护软件免遭攻击。

  总结

  在这种郁闷的环境中提出意见并不是很有趣,并且没有人想在转移那些可能永远不会发生的东西上面花钱。但是似乎对我来说,我们目睹了许多由环境退化和政治两极分化引起的危险期、灾难期和地理政治的紧张期。一种比较好的老式的灾难促使我们中断灾难恢复计划。这样做比等待现实灾难测试来我们的恢复计划效果要好得多。

【美国TechTarget独家授权】 Data warehouse disaster recovery 101

【原创内容,版权所有,谢绝转载。TechTarget中国将保留追究其法律责任的权利。】
作者:Wayne Eckerson     译者:April   
银行破产、全球经融动荡、信贷危机和销售萎靡使公司面临艰难的选择。一些公司仍在拥有少量资源中艰难度日,或者是面临破产,各地的主管都在努力寻找消减公司成本的方法。
由于商业智能(BI)赢得了众多的客户,Oracle在刚刚结束的民意调查中获得了更多的选票。Oracle在Gallup的产品经理Jim Collison表示,Gallup所获得的测验和调查的数据……
甲骨文和英特尔在正于美国旧金山举行的甲骨文全球大会上宣布,将就云计算展开合作,促企业级云计算发展及提高云计算的效率和安全性。
商业数据库在传统领域的市场竞争大的格局已经保持多年未变,而在商业智能方面的竞争日趋白热化。关于BI产产品市场份额的数据各大厂商一直众说纷纭,调查机构的数据……。
什么是BI?BI就是企业在运营上高层主管必须看的各项数据及分析资料。这些资料包括"总体运营状态分析统计资料"、"业务业绩达标率统计"……

本专题介绍了SQL Server服务代理相关方面的知识,包括SQL Server服务代理基础知识的概述、消息类型、契约、队列、服务和路由、SEND命令和RECEIVE命令、性能方面的改进以及对运行状况的监控等等。

无论你是否计划将SQL Server数据库转换服务(DTS)包迁移到SQL Server集成服务(SSIS)或在SQL Server 2005里运行DTS包,都需要专家的一些建议。这一指南主要是包括SSIS的相关基础知识、技巧帮助你进行SSIS调整,还介绍了SSIS有经验的一些用户的具体信息等等。

子查询是一个嵌套在SELECT、INSERT、UPDATE 或DELETE语句,或者另一个子查询里的查询。一个子查询可以返回一行或多行结果给父查询。标量子查询是只返回一个值的查询:只有一个字段的一行记录。标量子查询可以在SQL语句的大多数位置,其中你可以使用一个表达式或一个实际值。
最新更新
专家答疑
技巧
Michael Hillenbrand
你能解释一下数据库公程师、数据库架构师以及数据库管理员之间有什么区别吗?数据库管理员:这是目前最普遍使用的对从事数据库相关的工作的人的头衔。数据库管理员是指……
Brian Peasland
对5GB大小的Oracle 7.3存档或删除的最佳办法是什么?为了便于管理机构查询,这些数据至少需要再用20年的时间。我们担心将来我们不能对它重新获取并迁入一个更新的……
Rudy Limeback
如何创建一个约束限制2007年1月1日之前的日期被录入?用CHECK约束就可以。如下面的示例……