学习资源

思科

网络工程

华为

网络工程

红帽

系统运维

RHCSA

RHCE

RHCA

OpenStack

RHCVA

RHCSS

甲骨文

数据库

OCA

OCP

OCM

MySQL

微软

系统运维

MTA

MCSA

MCSE

软件开发

编程设计

Java

Android

HTML5

其他

Python

学习文章

当前位置：首页 > >学习文章 > >

{hadoop-ha}集群搭建

发布时间： 2017-12-18 15:37:34

一、准备环境

1.修改Linux主机名

2.修改IP

3.修改主机名和IP的映射关系 /etc/hosts

4.配置yum源

5.安装scp工具

[root@hdp01 yum.repos.d]# yum -y install openssh-clients

6.关闭防火墙

7.ssh免登陆

8.安装JDK，配置环境变量等

二、集群规划

说明：

1.在hadoop2.x中通常由两个NameNode组成，一个处于active状态，另一个处于standby状态。Active NameNode对外提供服务，而Standby NameNode则不对外提供服务，仅同步active namenode的状态，以便能够在它失败时快速进行切换。

hadoop2.x官方提供了两种HDFS HA的解决方案，一种是NFS，另一种是QJM。这里我们使用简单的QJM。在该方案中，主备NameNode之间通过一组JournalNode同步元数据信息，一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个JournalNode

这里还配置了一个zookeeper集群，用于ZKFC（DFSZKFailoverController）故障转移，当Active NameNode挂掉了，会自动切换Standby NameNode为standby状态

2.hadoop-2.x中依然存在一个问题，就是ResourceManager只有一个，存在单点故障，hadoop-2.8.1解决了这个问题，有两个ResourceManager，一个是Active，一个是Standby，状态由zookeeper进行协调

一、安装步骤

1. 安装配置zooekeeper集群（在hdp05上）机器部署安装到hdp05,hdp06,hdp07 3台虚拟机上

安装好JDK

上传上传zookeeper-3.4.11.tar.gz解压su – hadoop（切换到hadoop用户）

[hadoop@hdp05 ~]$ tar zxvf zookeeper-3.4.11.tar.gz -C apps（解压）重命名[hadoop@hdp05 ~]$ mv zookeeper-3.4.11 zookeeper（重命名文件夹zookeeper-3.4.11为zookeeper）修改环境变量1、[hadoop@hdp05 ~]$ su – root(切换用户到root)

2、[root@hdp05 ~]$ vi /etc/profile(修改文件)

3、添加内容：

ZOOKEEPER_HOME=/home/hadoop/apps/zookeeper

PATH=$ZOOKEEPER_HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export ZOOKEEPER_HOME HADOOP_HOME JAVA_HOME PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

4、重新编译文件：

[root@hdp05 ~]$ source /etc/profile

5、注意：3台zookeeper都需要修改

6、修改完成后切换回hadoop用户：

[hadoop@hdp05 ~]$ su - hadoop

修改配置文件

1、用hadoop用户操作

[hadoop@hdp05 ~]$ cd ~/apps/zookeeper/conf

[hadoop@hdp05 ~]$cp zoo_sample.cfg zoo.cfg

2、[hadoop@hdp05 ~]$vi zoo.cfg

3、添加内容：

dataDir=/home/hadoop/zookeeper/data

dataLogDir=/home/hadoop/zookeeper/log

server.1=slave1:2888:3888 (主机名, 心跳端口、数据端口)

server.2=slave2:2888:3888

server.3=slave3:2888:3888

4、创建文件夹：

[hadoop@hdp05 ~]$cd /home/hadoop/zookeeper/

[hadoop@hdp05 ~]$mkdir -m 755 data

[hadoop@hdp05 ~]$mkdir -m 755 log

5、在data文件夹下新建myid文件，myid的文件内容为：

[hadoop@hdp05 ~]$cd data

[hadoop@hdp05 ~]$vi myid

添加内容：

将集群下发到其他机器上：

[hadoop@hdp05 ~]$scp -r /home/hadoop/zookeeper hadoop@hdp06:/home/hadoop/

[hadoop@hdp05 ~]$scp -r /home/hadoop/zookeeper hadoop@hdp07:/home/hadoop/修改其他机器的配置文件到slave2上：修改myid为：2

到slave3上：修改myid为：3

启动（每台机器）

[hadoop@hdp05 ~]$zkServer.sh start

查看集群状态

1、 [hadoop@hdp05 ~]$jps（查看进程）

2、 [hadoop@hdp05 ~]$zkServer.sh status（查看集群状态，主从信息）

1. 安装配置hadoop集群

（在hdp01上操作）解压[hadoop@hdp05 ~]$tar -zxvf hadoop-2.8.1.tar.gz -C /home/hadoop/apps/

配置HDFS#将hadoop添加到环境变量中

[root@hdp05 ~]#vim /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_121

export HADOOP_HOME=/hadoop/hadoop-2.8.1

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin

修改配置文件

A. 修改hadoo-env.sh

export JAVA_HOME=/opt/jdk1.8.0_121

B. 修改core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/apps/hdpdata/</value>

</property>

<name>ha.zookeeper.quorum</name>

</property>

</configuration>

C. 修改hdfs-site.xml

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.sha</name>

</property>

<name>dfs.namenode.rpc-address.sha.nn1</name>

</property>

<name>dfs.namenode.http-address.sha.nn1</name>

</property>

<name>dfs.namenode.rpc-address.sha.nn2</name>

</property>

<name>dfs.namenode.http-address.sha.nn2</name>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hdp05:8485;hdp06:8485;hdp07:8485/sha</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/home/hadoop/journaldata</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.sha</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>

sshfence

shell(/shan/true)

</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/hadoop/.ssh/id_rsa</value>

</property>

<name>dfs.ha.fencing.ssh.connect-timeout</name>

</property>

</configuration>

D.修改mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

E.修改yarn-site.xml

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

</property>

<name>yarn.resourcemanager.zk-address</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

F. 修改slaves

slaves是指定子节点的位置，因为要在hdp01上启动HDFS、在hdp03启动yarn，所以hdp01上的slaves文件指定的是datanode的位置，hdp03上的slaves文件指定的是nodemanager的位置

hdp05

hdp06

hdp07

配置免密码登陆

#首先要配置hdp01到hdp02、hdp03、hdp04、hdp05、hdp06、hdp07的免密码登陆

#在hdp01上生产一对钥匙

ssh-keygen -t rsa

#将公钥拷贝到其他节点，包括自己

ssh-coyp-id hdp01

ssh-coyp-id hdp02

ssh-coyp-id hdp03

ssh-coyp-id hdp04

ssh-coyp-id hdp05

ssh-coyp-id hdp06

ssh-coyp-id hdp07

#配置hdp02到hdp03、hdp04、hdp05、hdp06、hdp07的免密码登陆

#在hdp02上生产一对钥匙

ssh-keygen -t rsa

#将公钥拷贝到其他节点

ssh-coyp-id hdp03

ssh-coyp-id hdp04

ssh-coyp-id hdp05

ssh-coyp-id hdp06

ssh-coyp-id hdp07

#注意：两个namenode之间要配置ssh免密码登陆，别忘了配置hdp01到hdp02的免登陆

在hdp01上生产一对钥匙

ssh-keygen -t rsa

ssh-coyp-id -i hdp01

将配置好的hadoop拷贝到其他节点：

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp02:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp03:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp04:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp05: /home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp06:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp07:/home/hadoop/apps

3.启动服务

注意：严格按照下面的步骤

A. 启动zookeeper集群（分别在hdp05、hdp06、hdp07上启动zk）

zkServer.sh start

#查看状态：一个leader，两个follower

zkServer.sh status

B. 启动journalnode（分别在在hdp05、hdp06、hdp07上执行）

hadoop-daemon.sh start journalnode

#运行jps命令检验，hdp05、hdp06、hdp07上多了JournalNode进程

C. 格式化HDFS

#在hdp01上执行命令:

hdfs namenode -format

#格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件，这里我配置的是/home/hadoop/apps/hdpdata/，然后将/home/hadoop/apps/hdpdata/拷贝到hdp02的/home/hadoop/apps/下。

scp -r /home/hadoop/apps/hdpdata hadoop@#hdp02:/home/hadoop/apps/

D. 格式化ZKFC(在hdp01上执行一次即可)

hdfs zkfc -formatZK

E. 启动HDFS(在hdp01上执行)

start-dfs.sh

F. 启动YARN

注意：是在hdp03上执行start-yarn.sh，把namenode和resourcemanager分开是因为性能问题，因为他们都要占用大量资源，所以把他们分开了，他们分开了就要分别在不同的机器上启动

start-yarn.sh

到此，hadoop-2.8.1配置完毕，可以统计浏览器访问:

http://hdp01:50070

NameNode 'hadoop01:9000' (active)

http://hdp02:50070

NameNode 'hadoop02:9000' (standby)

验证HDFS HA：

首先向hdfs上传一个文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然后再kill掉active的NameNode

kill -9 <pid of NN>

通过浏览器访问：http://hdp02:50070

NameNode 'hdp02:9000' (active)

这个时候hdp02上的NameNode变成了active

在执行命令：

hdp fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

刚才上传的文件依然存在！！！

手动启动那个挂掉的NameNode

hdp-daemon.sh start namenode

通过浏览器访问：http:// hdp01:50070

NameNode 'hdp01:9000' (standby)

验证YARN：

运行一下hdp提供的demo中的WordCount程序：

hadoop jar share/hdp/mapreduce/hdp-mapreduce-examples-2.4.1.jar wordcount /profile /out

OK，大功告成！！！

4. 测试集群工作状态的一些指令：

hdfs dfsadmin -report 查看hdfs的各节点状态信息

hdfs haadmin -getServiceState nn1 获取一个namenode节点的HA状态

hadoop-daemon.sh start namenode 单独启动一个namenode进程

hadoop-daemon.sh start zkfc 单独启动一个zkfc进程

QQ空间新浪微博腾讯微博人人网微信更多

上一篇： {思科CCIE-RS}BGP路由反射器及实验 BY乱雪纷飞

下一篇： {Java}-Redis安装

十五年老品牌

微信咨询：togogoi 咨询电话：18922156670 咨询网站客服：在线客服

网络技术

系统运维

数据库

云计算

安全

大数据

人工智能

项目管理

软件开发

其他

优选课程

高校合作

企业定制

考试中心

学习资源

关于我们

学习文章

{hadoop-ha}集群搭建

关于我们

联系我们

最新文章

客服热线

全国校区

关注我们