Cloudera Impala:将Hadoop变为分析型数据库

日期: 2012-10-25 作者:孙瑞 来源:TechTarget中国

近期人气颇高的Cloudera公司在Strata大会上发布了实时SQL查询引擎Impala,一时间引起了业界的广泛关注。Impala将同之前的的MapReduce一起成为Cloudera Hadoop的原生数据处理方式。对此,著名分析师Curt Monash也发表了他的看法,Monash认为Impala将成为Hadoop转向分析型数据库的重要工具,它与Hive之间的异同点包括:

  • Impala的查询语言(HQL,相当于SQL)、元数据以及JDBC/ODBC驱动等都与Hive兼容
  • Impala无需通过Hadoop MapReduce使用,这点与Hive有所不同
  • 同MapReduce+Hive方式相比,Impala不会将中间结果存储到磁盘,能够显著提升性能。但对于运行时间较长的查询则存在单点故障的风险,一旦出现故障将需要重新运行查询
  • 在Impala的第一版中将不包含部分Hive语法,如对UDF的支持

Cloudera Impala

  总体来说,虽然Impala同Hadapt相比还略显不成熟,但是它还是有很多优势:

  • 它是免费的
  • 它的可管理性更好
  • 它针对一些环境的性能是非常好的

  Cloudera公司已经开放了Impala的源代码,用户可以通过Github下载。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

孙瑞
孙瑞

相关推荐