不止是只有维度建模,数据仓库还有Data Vault建模
2024-07-28 19:02 | 分类:数据库 | 评论:0 次 | 浏览: 98
在数据仓库设计中,传统的星型和雪花型模型有着各自的优势和劣势。随着数据量的增大和数据源的多样化,Data Vault(数据仓库)建模方法逐渐...
史上最全的大数据开发八股文【自己的吐血总结】
2024-07-28 18:57 | 分类:数据库 | 评论:0 次 | 浏览: 97
我本硕都是双非计算机专业,从研一下开始学习大数据开发的相关知识,从找实习到秋招,我投递过100+公司,拿到过10+的offer,包括滴滴、字...
【Hadoop】MapReduce详解
2024-07-28 18:57 | 分类:数据库 | 评论:0 次 | 浏览: 76
MapReduce思想在生活中处处可见。MapReduce 的思想核心是“分而治之”,适用于大规模数据处理场景。Map负责“分”,即把复杂的...
基于Hadoop的豆瓣电影影评数据分析(大作业报告)
2024-07-28 18:57 | 分类:数据库 | 评论:0 次 | 浏览: 76
此篇博客主要记录我大三下学期大数据原理与技术这门课程的大作业内容
【Hadoop】--基于hadoop和hive实现聊天数据统计分析,构建聊天数据分析报表[17]
2024-07-28 18:56 | 分类:数据库 | 评论:0 次 | 浏览: 80
BI:Business Intelligence,商业智能。指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行分析以实现商业...
Hadoop上传文件到HDFS的步骤
2024-07-28 18:55 | 分类:数据库 | 评论:0 次 | 浏览: 83
随着大数据时代的到来,数据存储和处理变得至关重要。Hadoop作为大数据处理的基石,其分布式文件系统HDFS提供了高效、可靠的数据存储方案。...
Hadoop编写MapReduce程序计算超市销售数据月份销售总额
2024-07-28 18:55 | 分类:数据库 | 评论:0 次 | 浏览: 98
Hadoop分布式文件系统(HDFS)是Apache Hadoop生态系统的核心组件之一,用于存储和管理大规模数据集。它设计用于在廉价的硬件...
Hadoop+Hive数据分析综合案例
2024-07-28 18:52 | 分类:数据库 | 评论:0 次 | 浏览: 116
聊天平台每天都会有大量的用户在线,会出现大量的聊天数据,通过对聊天数据的统计分析,可以更好的对用户构建精准的用户画像,为用户提供更好的服务以...
Hadoop3.x完全分布式模式下slaveDataNode节点未启动调整
2024-07-28 18:50 | 分类:数据库 | 评论:0 次 | 浏览: 106
本文描述的是在Hadoop3.1.3的完全分布式环境下,slave节点的DataNode节点未能成功启动的问题以及通过修改配置来解决的办法,...
HBase-15-Phoenix
2024-07-28 18:45 | 分类:数据库 | 评论:0 次 | 浏览: 67
图中展示了,通过phoenix和hive对基于HDFS和HBase的数据记性查询的时候,随着数据量的增长,查询时间的变化曲线。◆使用本地的H...
HBase命令行操作
2024-07-28 18:44 | 分类:数据库 | 评论:0 次 | 浏览: 86
更改Student表的列族baseInfo的存储版本的限制为3(默认情况下,列族只存储一个版本的数据,如果需要存储多个版本的数据,则需要修改...
HBase伪分布式配置下,报错:org.apache.hadoop.hbase.PleaseHoldException: Master is initializing的解决方案
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 79
HBase伪分布式配置下,报错:org.apache.hadoop.hbase.PleaseHoldException: Master is...
【Hbase】Hbase TableInputFormat、TableOutputFormat
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 87
TableInputFormat是Apache HBase中的一个重要的类,它允许MapReduce作业直接从HBase表中读取数据作为其输...
JDK从8升级到11,使用 G1 GC,HBase性能下降20%。JDK 到底干了什么
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 87
结论:使用 G1 GC,JDK 11 相对于 JDK 8 来说性能明显下降。3原因分析=====从 JDK 8 到 JDK 11, G1 G...
大数据基础知识-Hadoop、HBase、Hive一篇搞定
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 79
相应的,数据库由于规模较小,因此可以支持的数据规模较小,一般单张表中能存储百万条数据(最新版的MySQL经过优化,单表中可以存储千万条或者上...
HBase安装,配置,启动,检查
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 100
HBase安装,配置,启动,安装检验 (进程查看,web UI界面,客户端交互)
archive
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 77
就拿时间这个变量来说,我们一般认为时间是连续的,它确实是连续的,但是,我们用科学的测量,是没法把时间测成连续的,也就是说,我们哪怕用微秒纳秒...
Hive-存储-文件格式
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 87
数据存储是Hive的基础,选择合适的底层数据存储格式,可以在不改变Hql的前提下得到大的性能提升。类似mysql选择适合场景的存储引擎。Hi...
HiveSQL题——炸裂函数(explode/posexplode)
2024-07-28 18:42 | 分类:数据库 | 评论:0 次 | 浏览: 66
HiveSQL题——炸裂函数(explode/posexplode)
【超详细】HIVE 日期函数(当前日期、时间戳转换、前一天日期等)
2024-07-28 18:42 | 分类:数据库 | 评论:0 次 | 浏览: 82
【超详细】HIVE 日期函数(当前日期、时间戳转换、前一天日期等)常量:当前日期、时间戳前一天日期、后一天日期获取日期中的年、季度、月、周、...
大数据Hadoop之——部署hadoop+hive+Mysql环境(Linux)
2024-07-28 18:42 | 分类:数据库 | 评论:0 次 | 浏览: 88
-是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是 true -->--是否启动一个线程检查...
【hive】hive进阶:案例解析(第18天)
2024-07-28 18:41 | 分类:数据库 | 评论:0 次 | 浏览: 64
本文主要介绍hive的表操作,内外部表,分区分桶表,hive复杂类型,Hive乱码解决。