Hadoop平台集群搭建

jopen 11年前

1. Linux配置hadoop环境

环境：Ubuntu10 linux、jdk-7-linux-i586.tar.gz

1.1 将jdk上传到Ubuntu

a.在虚拟机中设置->选项->共享文件夹

b.拖到指定文件

c.使用命令tar zxvf jdk-7-linux-i586.tar.gz 解压文件

d.将解压好的jdk文件夹用最高权限复移动到/usr/jdk目录里

sudo su

cp -r jdk-7-linux-i586.tar.gz /usr/jdk(放在opt目录比较好)

e.设置环境变量

sudo gedit etc/profile

f.添加java-home

export JAVA_HOME=/usr/jdk/jdk1.7.0

export JRE_HOME=/usr/jdk/jdk1.7.0/jre

Export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$PATH

g. source /etc/profile

这个时候，java -version ，可以看到自己的jdk配置成功了，如果你没有出现，再看看。

1.2 配置ssh

a.sudo apt-get update

b.sudo apt-get install openssh-server

结束言：ssh是一种基于公钥和私钥的加密安全方式，最开始master守护进程会产生一对密钥，称作公钥和私钥，并且把公钥发送到各个slaver，自己则把私钥保存，各个slave通过特定的机制把一串消息放回给master，后者将这串消息和自己的私钥进行核对，如果符合则连接成功。

Hadoop平台集群搭建

生成本地的key，可以到根目录查看，ls -al命令，会多了一个.ssh的文件，里面会有一个私钥和公钥

Hadoop平台集群搭建

复制一份公钥并重命名叫做authorized_keys，拷贝到slaver datanode节点，这里只做一个slaver，如果有多个slaver,就重复复制到不同的datanode节点上。（这里折腾了好久哦，大家要注意写法了）

接下来风别配置下面的三个文件，这里不做解释了，直接贴图，这些文件就在hadoop文件的conf文件夹里面

Hadoop平台集群搭建

之后格式化hdfs，看有没有报错哦

Hadoop平台集群搭建

然后就可以跑一下了，这里要注意权限问题哦，哥在这里搞了好久呢

Hadoop平台集群搭建

打开网页，看看部署的结果

Hadoop平台集群搭建

文件系统里面，有一个文件，这个文件就是我创建的tmp用来保存批处理文件的。至此部署成功。