本文介绍如何在debian系统中高效查看hadoop日志。hadoop的日志聚合功能将各个节点的日志集中存储,方便管理。以下步骤将指导您如何查看这些日志:
第一步:确保日志聚合已启用
首先,确认hadoop集群所有节点都启用了日志聚合。这通常在yarn-site.xml配置文件中配置:
<property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>172800</value> </property> <property> <name>yarn.nodemanager.remote-app-log-dir</name> <value>/tmp/logs</value> </property> <property> <name>yarn.nodemanager.remote-app-log-dir-suffix</name> <value>logs</value> </property> <property> <name>yarn.log.server.url</name> <value>http://hadoop-node0:19888/jobhistory/logs</value> </property>
登录后复制
第二步:通过web ui访问日志
日志聚合后,您可以通过hadoop的resourcemanager web ui或job history server web ui查看日志:
-
resourcemanager web ui: 默认地址为http://
:8088/cluster/apps/finished。 -
job history server web ui: 默认地址为http://
:19888/jobhistory。
第三步:使用命令行工具查看日志
如果您需要直接从hdfs读取日志,可以使用hdfs dfs命令:
hdfs dfs -cat /path/to/logs/*
登录后复制
第四步:使用文本编辑器查看日志
您可以使用任何文本编辑器(如nano、vim)打开并查看日志文件:
sudo nano /path/to/logs/application-<application-id>-container-<container-id>.log
登录后复制
请注意,日志文件路径和url可能因hadoop集群配置而异。请参考您的hadoop集群配置文件以获取准确的路径。
以上就是debian hadoop 日志如何查看的详细内容,更多请关注代码网其它相关文章!
发表评论