当前位置: 代码网 > it编程>数据库>Mysql > 大数据之HDFS框架

大数据之HDFS框架

2024年07月31日 Mysql 我要评论
HDFS分布式文件存储系统介绍


前言

#博学谷it学习技术支持#
hadoop是一些软件的统称,其底层是java;hadoop主要包含hdfs分布式文件存储框架、mapreduce分布式计算框架和yarn分布式资源调度框架。本篇文章主要介绍hadoop中的hdfs框架。

一、hdfs介绍

hdfs的全称是hadoop distributed file system,hadoop分布式文件系统。该系统是一个由多台计算机组成的集群,主要看重整体集群的工作效率,不注重单台计算机的性能,所以无论多低配置的计算机都可以加入该集群中。
hdfs系统具有文件切片的机制,可以将一个较大的文件进行切片,切分成多个较小的文件存储在该集群中不同的计算机上,取数据时再将所有的小文件进行合并,返回给客户端。

二、架构介绍

在这里插入图片描述

从上图可以看出,hdfs系统中的角色有namenode、secondaryname和datanode。这三个角色有各自的分工,从而是hdfs集群可以正常运行。

  • namenode
  1. namenode管理整个hdfs集群
  2. namenode管理整个集群中的元数据,元数据就是文件在系统中存储的相关信息,不是文件内容
  3. client客户端上传和下载数据都需要经过namenode,从而获取元数据的信息
  4. namenode是hdfs集群的核心,该角色一当掉,hdfs集群停止运行
(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com