TechTarget数据库>技术手册

数据库新技术风向标之Hadoop

数据库新技术风向标之Hadoop
免费下载 PDF

Hadoop是一个分布式系统架构,它可以用来应对海量数据的存储,而这样的数据量往往是以PB甚至ZB来计算的。Hadoop的存储系统我们称作Hadoop Distributed File System(HDFS)。在本次数据库电子书中,我们将为您解读Hadoop的概念和应用。

目录:

  • >未来商业智能系统:Hadoop来当家

    Hadoop是一个分布式系统架构,它可以用来应对海量数据的存储,而这样的数据量往往是以PB甚至ZB来计算的。Hadoop的存储系统我们称作Hadoop Distributed File System(HDFS),它是由Doug Cutting创建的,其灵感来源于Google的一篇学术论文。

  • >大数据分析时代:Hadoop MapReduce

    像Hadoop和R语言这样的开源工具已经成功开启了大数据分析之门。开源虽然在这一方面起到了非常积极的作用,但是它们是以一种不太成熟的方式进入市场的。大数据时代,Hadoop MapReduce任重道远。

  • >Hadoop的首要任务是标准化

    虽然流行度逐渐升温,但是根据Forrester研究机构的高级数据管理分析师James Kobielus的说法,开源技术Hadoop在应对大数据分析时还存在这一定的障碍。其中包括了如何存储上百TB的数据以及Hadoop互操作性标准的缺失。

  • >企业如何选择数据库新技术

    最近,像NoSQL数据库、Hadoop和MapReduce等新兴数据库技术正逐渐地成为使用传统关系型数据库的企业,特别是那些依赖高度数据集成计算需求的企业,进行系统选型的主流替代品。

  • >深入理解Hadoop与数据仓库的概念

    最近,像NoSQL数据库、Hadoop和MapReduce等新兴数据库技术正逐渐地成为使用传统关系型数据库的企业,特别是那些依赖高度数据集成计算需求的企业,进行系统选型的主流替代品。

  • >Hadoop 数据类型与文件结构剖析

    SequenceFile 是 Hadoop 的一个重要数据文件类型,它提供key-value的存储,但与传统key-value存储(比如hash表,btree)不同的是,它是appendonly的,于是你不能对已存在的key进行写操作。

更多技术手册>更多