RedShift将改变云数据仓库游戏规则

日期: 2014-06-15 作者:David Linthicum翻译:孙瑞 来源:TechTarget中国 英文

从以往的经验来看,企业数据仓库是一个十分昂贵的投资。无论部署在什么样的数据库之上,企业都需要花上百万的钱才能让它正常地运转下去。

实际上,虽然业界对它的定义有着不同的看法,但数据仓库基本上就是一个包含抽象交易数据的数据库,用来做业务决策的支持。企业会在这些数据基础上使用分析工具,然后再通过不同的方式展示给企业决策者,比如报表以及可视化数据等。

在过去,Teradata、Oracle等IT巨头基本上形成了对数据仓库市场的垄断。而随着云解决方案的出现,比如公有云服务提供商的数据仓库存储,使得构建部署数据仓库的成本得到了极大程度的降低。

亚马逊推出的Redshift 服务对于传统数据仓库厂商势必会造成一定的冲击,它改变了游戏规则,用户可以在云端来构建自己的数据仓库系统。通过基于列式的存储技术,RedShift能够提供快速的查询性能,而这一技术已经被广泛地应用中企业数据仓库领域。

列式数据库是一个概念或者说是一个架构。许多列式数据库都是在传统的行式关系型数据库基础上构建的。它能够在数据库表中存储1-2个列的信息,在此基础上添加必要的元素来对列数据进行访问。RedShift就是典型的例子,但它的特别之处在于你能够通过公有云服务来“消费”数据。

列式数据库存储能够提升I/O效率,将查询并行地分布到多个服务器实例上。由于服务实例能够在AWS服务上按需扩展,因此用户可以以自助的方式来对服务实例进行调配从而支撑数据查询,甚至实现自动化。

RedShift使用了标准化的PostgreSQLJDBC 和ODBC驱动,能够支持用户使用熟悉的SQL语言控制查询。数据加载性能在集群环境下能够接近线性地扩展,同时可以与Amazon S3、AmazonDynamoDB、AmazonElastic MapReduce、AmazonKinesis以及任何SSH托管服务进行集成。换句话说,RedShift是一个具备高度可扩展性和高性价比的列式数据库。

一个核心问题就是成本价值。很明显,当利用云计算来交付服务时,在大多数情况下它的成本价值要明显优于传统的软硬件部署模式。RedShift也不例外,想要找到一个高性能高性价比的数据仓库解决方案是非常昂贵的。

企业目前大部分的数据还是存储在自己的数据中心当中,迁移到云端则是大势所趋。然而,对于海量数据来说,无论是以每天的频率还是每周的频率,迁移到云端可能会比想象的更复杂一些。

数据本身也可能制造一些问题,比如不同的地区会对数据存放的位置有严格的法规要求。数据合规的问题也是阻碍云计算成为主流的重要原因之一。因此在进行规划的时候,一定要把它考虑在内。

那么到底要不要选择RedShift?答案是肯定的,至少你应该将云数据仓库作为主要的考量之一。时间与金钱的节省是非常可观的,它使得数据仓库不再是土豪的游戏,云计算将进一步推动数据仓库在中小企业中的普及。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

David Linthicum
David Linthicum

国际知名云计算专家,分析机构Cloud Technology Partners公司高级副总裁。

翻译

孙瑞
孙瑞

相关推荐