当前位置: 代码网 > it编程>编程语言>Java > 如何安装Hadoop并运行WordCount程序

如何安装Hadoop并运行WordCount程序

2025年05月14日 Java 我要评论
一、安装 javahadoop 依赖 java,首先需要安装 java 开发工具包(jdk)。以 ubuntu 为例:sudo apt updatesudo apt install openjdk-8

一、安装 java

hadoop 依赖 java,首先需要安装 java 开发工具包(jdk)。以 ubuntu 为例:

sudo apt update
sudo apt install openjdk-8-jdk

安装后,设置环境变量:

echo 'export java_home=/usr/lib/jvm/java-8-openjdk-amd64' >> ~/.bashrc
echo 'export path=$path:$java_home/bin' >> ~/.bashrc
source ~/.bashrc

二、安装 hadoop

下载 hadoop

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
tar -xzf hadoop-3.3.6.tar.gz
mv hadoop-3.3.6 /opt/hadoop

配置环境变量

echo 'export hadoop_home=/opt/hadoop' >> ~/.bashrc
echo 'export path=$path:$hadoop_home/bin:$hadoop_home/sbin' >> ~/.bashrc
source ~/.bashrc

配置 hadoopcore-site.xml

<configuration>
    <property>
        <name>fs.defaultfs</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

hdfs-site.xml

xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/opt/hadoop/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/opt/hadoop/data/datanode</value>
    </property>
</configuration>

三、启动 hadoop

格式化 namenode

hdfs namenode -format

启动 hdfs 和 yarn

start-dfs.sh
start-yarn.sh

验证服务
访问 http://localhost:9870 查看 hdfs 界面,http://localhost:8088 查看 yarn 界面。

四、运行 wordcount 程序

准备输入数据

echo "hello hadoop world" > input.txt
hdfs dfs -mkdir -p /user/input
hdfs dfs -put input.txt /user/input

执行 wordcount

hadoop jar $hadoop_home/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/input /user/output

查看结果

hdfs dfs -cat /user/output/part-r-00000

到此这篇关于如何安装hadoop并运行wordcount程序的文章就介绍到这了,更多相关hadoop安装和wordcount程序内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com