hadoop基于Linux7的安装配置图文详解

2026-05-08 02:30:08

如上图准备好该准备的食材（ps：其中的hadoop-3.1.2-src更改为hadoop-3.1.2

src为源文件的意思？反正就是换了大家注意一下后面截图有错的地方有空我再改吧肝疼）

安装好centos7

桌面右键打开terminal——输入ifconfig——查看ens33的ip——记住然后打开xftp6

点击新建

把食材多选，右键传输即可，内网传输速度不快不慢

所示很完美了

解压hadoop安装包 tar -zxvf hadoop-3.1.2-src.tar.gz

重新装了centos7 解压的时候分文件夹了

如上图编写

打开xshell 新建

输入你的主机ip 在用户身份验证上写上用户名和密码

yes就完事了——然后三台机器都需要改了名字

时间同步 时区一致。要保证设置主机时间准确，每台机器时区必须一致。实验中我们需要同步网络时间，因此要首先选择一样的时区。先确保时区一样，否则同步以后时间也是有时区差。可以使用 date 命令查看自己的机器时间. 选择时区：tzselect

1.关闭防火墙

当其状态是 dead 时，即防火墙关闭。关闭防火墙：systemctl stop firewalld 查看状态：systemctl status firewalld

2. hosts文件配置（三台机器） 如下图输入各节点的ip

3. master 作为 ntp 服务器，修改 ntp 配置文件。（master 上执行）

vi /etc/ntp.conf
	server 127.127.1.0 # local clock
	fudge 127.127.1.0 stratum 10 #stratum 设置为其它值也是可以的，其范围为 0~15

	重启 ntp 服务。
	/bin/systemctl restart ntpd.service

	其他机器同步（slave1，slave2）
	等待大概五分钟，再到其他机上同步该 master 服务器时间。
	ntpdate master

	如果配置平台式没有外网连接可以将三台机器设为统一时间，输入命令：
	date -s 10:00（时间）

终于走到正题？？？ 别慌快了

1. SSH免密

（1）每个结点分别产生公私密钥：

ssh-keygen -t dsa -P ‘' -f ~/.ssh/id_dsa（三台机器）
秘钥产生目录在用户主目录下的.ssh 目录中，进入相应目录查看：
cd .ssh/

（2）Id_dsa.pub 为公钥，id_dsa 为私钥，紧接着将公钥文件复制成 authorized_keys 文件：（仅 master）

cat id_dsa.pub >> authorized_keys（注意在.ssh/路径下操作）

在主机上连接自己，也叫做 ssh 内回环。
ssh master

（3）让主结点 master 能通过 SSH 免密码登录两个子结点 slave。（slave 中操作）

为了实现这个功能，两个 slave 结点的公钥文件中必须要包含主结点的公钥信息，这样
当 master 就可以顺利安全地访问这两个 slave 结点了。
slave1 结点通过 scp 命令远程登录 master 结点，并复制 master 的公钥文件到当前的目录
下，且重命名为 master_das.pub，这一过程需要密码验证。

scp master:~/.ssh/id_dsa.pub ./master_das.pub

将 master 结点的公钥文件追加至 authorized_keys 文件：

cat master_das.pub >> authorized_keys

（1）每个结点分别产生公私密钥： ssh-keygen -t dsa -P ‘' -f ~/.ssh/id_dsa（三台机器）秘钥产生目录在用户主目录下的.ssh 目录中，进入相应目录查看： cd .ssh/ （2）Id_dsa.pub 为公钥，id_dsa 为私钥，紧接着将公钥文件复制成 authorized_keys 文件：（仅 master） cat id_dsa.pub >> authorized_keys（注意在.ssh/路径下操作）在主机上连接自己，也叫做 ssh 内回环。 ssh master

这时，

master 就可以连接 slave1 了。

slave1 结点首次连接时需要，“yes”确认连接，这意味着 master 结点连接 slave1 结点时需要人工询问，无法自动连接，输入 yes 后成功接入，紧接着注销退出至 master 结点。

同理 slave2 中也是这么操作

jdk之前已经安装好了，所以我们直接来配环境，就和windows的时候配环境变量一个道理(三台)

修改环境变量：vi /etc/profile
> 添加内容如下：
> export JAVA_HOME=/usr/java/jdk1.8.0_241
> export CLASSPATH=$JAVA_HOME/lib/export
> PATH=$PATH:$JAVA_HOME/bin
> export PATH JAVA_HOME CLASSPATH

生效环境变量：source /etc/profile

插播一个小技巧scp

scp /etc/profile slave1:/etc/profile ##这样就可以传给slave1 和slave2了

终于到hadoop了？？？恭喜宁！

配置环境变量：
vi/etc/profile
export HADOOP_HOME=/usr/hadoop/hadoop-3.1.2
export CLASSPATH=$CLASSPATH:$HADOOP_HOME/lib
export PATH=$PATH:$HADOOP_HOME/bin

我经常忘的一步大声告诉我是什么！

使用以下命令使profile生效： source /etc/profile

温馨提示下面就是配置文件的内容了本文暂时不做讲解内容但是我已经给大家准备好标准的配置文件了

编辑hadoop环境配置文件hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_241
在这个文件里面会有好多注释的语句，找到你要配置的模板把井号删除完善即可 耐心找一下

然后我偷懒的地方就要到了！！！！！我上传了几个配置文件我们复制到这个文件夹中即可系统提示是否覆盖时候就输入y即可

core-site.xml yarn-site.xml hdfs-site.xml mapred-site.xml

还需要写一下slave文件加上slave1 slave2如下图

还有master文件

（9）分发hadoop：
scp -r /usr/hadoop root@slave1:/usr/
scp -r /usr/hadoop root@slave2:/usr/

master中格式化hadoop hadoop namenode -format 如果报错的话看看是不是如下链接的错误里面有解决办法

总结

以上所述是小编给大家介绍的hadoop基于Linux7的安装配置图文详解，希望对大家有所帮助!

linux环境不使用hadoop安装单机版spark的方法

大数据持续升温, 不熟悉几个大数据组件, 连装逼的口头禅都没有. 最起码, 你要会说个hadoop, hdfs, mapreduce, yarn, kafka, spark, zookeeper, neo4j吧, 这些都是装逼的必备技能. 关于spark的详细介绍, 网上一大堆, 搜搜便是, 下面, 我们来说单机版的spark的安装和简要使用. 0. 安装jdk, 由于我的机器上之前已经有了jdk, 所以这一步我可以省掉. jdk已经是很俗气的老生常谈了, 不多说, 用java/scala的
linux下搭建hadoop环境步骤分享

1.下载hadoop包 wget http://apache.freelamp.com/hadoop/core/stable/hadoop-0.20.2.tar.gz2.tar xvzf hadoop-0.20.2.tar.gz3.安装JDK,从oracle网站上直接下载JDK,地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html4.chmod +x jdk-6u21-linux-i586.bin;./jdk-
Linux中Centos7搭建Hadoop服务步骤

下载Hadoop 官网:http://hadoop.apache.org/releases.html 先配置jdk环境(教程:http://www.jb51.net/article/108936.htm) 下载以后解压到到/usr/local tar -zxvf hadoop-2.8.0.tar.gz -C /usr/local 为了方便操作把hadoop-2.8.0 改为hadoop mv /usr/local/hadoop-2.8.0 /usr/local/hadoop 查看主机名 ho
Linux中安装配置hadoop集群详细步骤

一. 简介参考了网上许多教程,最终把hadoop在ubuntu14.04中安装配置成功.下面就把详细的安装步骤叙述一下.我所使用的环境:两台ubuntu 14.04 64位的台式机,hadoop选择2.7.1版本.(前边主要介绍单机版的配置,集群版是在单机版的基础上,主要是配置文件有所不同,后边会有详细说明) 二. 准备工作 2.1 创建用户创建用户,并为其添加root权限,经过亲自验证下面这种方法比较好. sudo adduser hadoop sudo vim /etc/sudoers
hadoop基于Linux7的安装配置图文详解

如上图准备好该准备的食材(ps:其中的hadoop-3.1.2-src更改为hadoop-3.1.2 src为源文件的意思? 反正就是换了大家注意一下后面截图有错的地方有空我再改吧肝疼) 安装好centos7 桌面右键打开terminal--输入ifconfig--查看ens33的ip--记住然后打开xftp6 点击新建把食材多选,右键传输即可,内网传输速度不快不慢所示很完美了解压hadoop安装包 tar -zxvf hadoop-3.1.2-src.tar.gz 重新装了cen
Windows Server 2016 IIS10 安装配置图文详解

一.进入服务器管理器 1.开始菜单 2.服务器管理器 3.管理 4.添加角色和功能向导二.开始之前单击"下一步" 三.安装类型选择"基于角色或基于功能的安装"->单击"下一步" 四.服务器选择选择"从服务器池中选择服务器"->单击"下一步" 五.服务器角色 1.选择"Web服务器(IIS)" 2.添加Web服务器(IIS)所需的功能->单击"增加功能&
windows系统下node.js环境配置与安装教程图文详解(详细版)

国内目前关注最高,维护最好的一个关于nodejs的网站应该是http://www.cnodejs.org/ windows系统下简单nodejs环境配置. 第一步:下载安装文件下载地址:官网https://nodejs.org/en/download/ 这里用的是第二步:安装nodejs 下载完成之后,双击 node-v6.9.1-x64.msi,开始安装nodejs,默认是安装在C:\Program Files\nodejs下面第三步:安装相关环境打开C:\Program Files\
CLion安装、汉化、配置图文详解

CLion是一款专为开发C及C++所设计的跨平台IDE.它是以IntelliJ为基础设计的,包含了许多智能功能来提高开发人员的生产力,提高开发人员的工作效率. 这种强大的IDE帮助开发人员在Linux.OS X和Windows上来开发C/C++,同时它还使用智能编辑器来提高代码质量.自动代码重构并且深度整合CMake编译系统,从而提高开发人员的开发效率. 我们下载: clion 2018怎么破解?Jetbrains CLion 2018.1安装激活汉化配置图文教程一.CLion下载安装(Win
centOS7下Spark安装配置教程详解

环境说明: 操作系统: centos7 64位 3台 centos7-1 192.168.190.130 master centos7-2 192.168.190.129 slave1 centos7-3 192.168.190.131 slave2 安装spark需要同时安装如下内容: jdk scale 1.安装jdk,配置jdk环境变量这里不讲如何安装配置jdk,自行百度. 2.安装scala 下载scala安装包,https://www
mysql-8.0.16 winx64的最新安装教程图文详解

最近刚学习数据库,首先是了解数据库是什么,数据库.数据表的基本操作,这就面临了一个问题,mysql的安装,我这里下载的是64位的,基于Windows的,以下是在我电脑上的安装过程,希望可以帮助到大家. 1.在mysql的官网上去下载,链接是 https://dev.mysql.com/downloads/mysql/ ,如图1-1,1-2所示,点击downloads,然后会弹出图1-3,点击No thanks,jast start my download.即可,当然你也可以注册一下. 图 1-1
Python和Anaconda和Pycharm安装教程图文详解

Anaconda 是一个基于 Python 的数据处理和科学计算平台,它已经内置了许多非常有用的第三方库,装上Anaconda,就相当于把 Python 和一些如 Numpy.Pandas.Scrip.Matplotlib 等常用的库自动安装好了,使得安装比常规 Python 安装要容易.如果选择安装Python的话,那么还需要 pip install 一个一个安装各种库,安装起来比较痛苦,还需要考虑兼容性,非如此的话,就要去Python官网(https://www.python.org/dow
Maven安装过程图文详解

Maven 是一个基于 Java 的工具,所以要做的第一件事情就是安装 JDK. maven作用其中maven的主要作用有: 项目管理:编译.测试.打包.部署.运行,这一套流程都可以用maven来管理. 管理jar包:也就是上述提到的问题. 管理插件:开发过程中会需要使用各种插件. 下载地址:http://maven.apache.org/download.cgi 下载后解压到自己想安装的目录配置环境变量: MAVEN_HOME : D:\ProgramFiles\apache-maven-
Microsoft Sql server2005的安装步骤图文详解及常见问题解决方案

一:安装sql server 2005过程中出现如下问题:"选择的功能中没有任何功能可以安装或升级": 解决方案:Microsoft SQL Server 2005→配置工具→SQL配置管理器→SQL Server 2005服务→右边的两个服务启动SQL Server FullTest Search() 和服务SQl Sever(计算机名) 二:无法将数CLSID写入\Software\Classes\PROTOCOLS\Handler\ms-help. 解决办法:退出电脑安全软件三
mysql 5.7.17的最新安装教程图文详解

mysql-5.7.17-winx64是现在最新版本的Mysql,这是免安装的,所以要进行些配置下载地址:https://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.17-winx64.zip 1:下载安装包,将其解压到一个文件夹下 2:复制my-default.ini,并重命名为my.ini,然后用记事本打开输入mysql的基本配置: [mysql] ; 设置mysql客户端默认字符集 default-character-set=utf8 [my

hadoop基于Linux7的安装配置图文详解

相关推荐

随机推荐