0%

一、Hadoop

  1. Hadoop是一个由Apache基金会所开发的分布式系统基础架构

  2. 充分利用集群的威力进行高速运算和存储,具有可靠、高效、可伸缩的特点

  3. Hadoop的核心是Yarn、HDFS和MapReduce

    • 适合大数据的分布式存储与计算平台
    • HDFS: Hadoop Distributed File System分布式文件系统
    • MapReduce:并行计算框架
Read more »

1.从Hadoop整体框架来说

1.1 Hadoop1.0即第一代Hadoop,由分布式存储系统HDFS和分布式计算框架MapReduce组成,其中HDFS由一个NameNode和多个DateNode组成,MapReduce由一个JobTracker和多个TaskTracker组成。
1.2 Hadoop2.0为克服Hadoop1.0中的不足:针对Hadoop1.0单NameNode制约HDFS的扩展性问题,提出HDFS Federation,它让多个NameNode分管不同的目录进而实现访问隔离和横向扩展,同时彻底解决了NameNode单点故障问题;
针对Hadoop1.0中的MapReduce在扩展性和多框架支持等方面的不足,它将JobTracker中的资源管理和作业控制分开,分别由ResourceManager(负责所有应用程序的资源分配)和ApplicationMaster(负责管理一个应用程序)实现,即引入了资源管理框架Yarn。同时Yarn作为Hadoop2.0中的资源管理系统,它是一个通用的资源管理模块,可为各类应用程序进行资源管理和调度,不仅限于MapReduce一种框架,也可以为其他框架使用,如Tez、Spark、Storm等

Read more »

Hadoop 指令

1.ls

hadoop fs -ls  /

列出hdfs文件系统根目录下的目录和文件

hadoop fs -ls -R /

列出hdfs文件系统所有的目录和文件

Read more »

一个人走进另一个人的世界是多么美好的一件事啊。

从相见到相识,从相知到相认,从独立的生命个体到相互牵连的二人世界。

每一个过程,每一个细节,都是这个世界上最美好的东西。

Read more »

【一】

他和她,第一次相见是在游戏里,两个角色的对话。现在说来都不算是正式见面呢。

“你好。”

“……”

“那个,他们都组完队了,就剩下咱俩了……”

Read more »