当前位置: 代码网 > 服务器>网络>https > Debian上Hadoop开发环境如何搭建

Debian上Hadoop开发环境如何搭建

2025年03月30日 https 我要评论
本指南详细介绍如何在debian系统上搭建hadoop开发环境。一、安装java开发套件(jdk)首先,安装openjdk:sudo apt updatesudo apt install openjd

debian上hadoop开发环境如何搭建

本指南详细介绍如何在debian系统上搭建hadoop开发环境。

一、安装java开发套件(jdk)

首先,安装openjdk:

sudo apt update
sudo apt install openjdk-11-jdk -y
登录后复制

配置java_home环境变量:

sudo nano /etc/environment
登录后复制

在文件末尾添加(根据实际jdk版本调整路径):

java_home="/usr/lib/jvm/java-11-openjdk-amd64"
登录后复制

保存并退出,然后执行:

source /etc/environment
登录后复制

验证安装:

java -version
登录后复制

二、安装hadoop

下载hadoop 3.3.6 (或其他版本):

wget https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-src.tar.gz
登录后复制

验证下载完整性:

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-src.tar.gz.sha512
sha256sum -c hadoop-3.3.6-src.tar.gz.sha512
登录后复制

创建目录并解压:

sudo mkdir /opt/hadoops
sudo tar -xzvf hadoop-3.3.6-src.tar.gz -c /opt/hadoops --strip-components 1
登录后复制

三、配置hadoop环境变量

编辑/etc/profile文件,添加:

export hadoop_home="/opt/hadoops/hadoop-3.3.6"
export path=$path:$hadoop_home/bin:$hadoop_home/sbin
登录后复制

刷新环境变量:

source /etc/profile
登录后复制

四、配置hadoop核心配置文件

编辑core-site.xml:

sudo nano $hadoop_home/etc/hadoop/core-site.xml
登录后复制

添加:

<configuration>
  <property>
    <name>fs.defaultfs</name>
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>
登录后复制

编辑hdfs-site.xml:

sudo nano $hadoop_home/etc/hadoop/hdfs-site.xml
登录后复制

添加:

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/opt/hadoops/hdfs/namenode</value>
  </property>
</configuration>
登录后复制

编辑mapred-site.xml:

sudo nano $hadoop_home/etc/hadoop/mapred-site.xml
登录后复制

添加:

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>
登录后复制

编辑yarn-site.xml:

sudo nano $hadoop_home/etc/hadoop/yarn-site.xml
登录后复制

添加:

<configuration>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
</configuration>
登录后复制

五、设置ssh无密码登录

生成ssh密钥:

sudo su - hadoop
ssh-keygen -t rsa -p ""
登录后复制

复制公钥:

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
登录后复制

测试连接:

ssh localhost
登录后复制

六、格式化namenode

hdfs namenode -format
登录后复制

七、启动hadoop服务

start-dfs.sh
start-yarn.sh
登录后复制

八、验证hadoop安装

检查集群状态:

hdfs dfsadmin -report
登录后复制

访问namenode web界面:http://localhost:9870

完成以上步骤后,您的debian系统上的hadoop开发环境就搭建完成了。 请根据实际情况调整路径和hadoop版本。

以上就是debian上hadoop开发环境如何搭建的详细内容,更多请关注代码网其它相关文章!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com