史上最全的大数据开发八股文【自己的吐血总结】
2024-07-28 18:57 | 分类:数据库 | 评论:0 次 | 浏览: 46
我本硕都是双非计算机专业,从研一下开始学习大数据开发的相关知识,从找实习到秋招,我投递过100+公司,拿到过10+的offer,包括滴滴、字...
【Hadoop】MapReduce详解
2024-07-28 18:57 | 分类:数据库 | 评论:0 次 | 浏览: 37
MapReduce思想在生活中处处可见。MapReduce 的思想核心是“分而治之”,适用于大规模数据处理场景。Map负责“分”,即把复杂的...
基于Hadoop的豆瓣电影影评数据分析(大作业报告)
2024-07-28 18:57 | 分类:数据库 | 评论:0 次 | 浏览: 37
此篇博客主要记录我大三下学期大数据原理与技术这门课程的大作业内容
【Hadoop】--基于hadoop和hive实现聊天数据统计分析,构建聊天数据分析报表[17]
2024-07-28 18:56 | 分类:数据库 | 评论:0 次 | 浏览: 38
BI:Business Intelligence,商业智能。指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行分析以实现商业...
Hadoop上传文件到HDFS的步骤
2024-07-28 18:55 | 分类:数据库 | 评论:0 次 | 浏览: 39
随着大数据时代的到来,数据存储和处理变得至关重要。Hadoop作为大数据处理的基石,其分布式文件系统HDFS提供了高效、可靠的数据存储方案。...
Hadoop编写MapReduce程序计算超市销售数据月份销售总额
2024-07-28 18:55 | 分类:数据库 | 评论:0 次 | 浏览: 45
Hadoop分布式文件系统(HDFS)是Apache Hadoop生态系统的核心组件之一,用于存储和管理大规模数据集。它设计用于在廉价的硬件...
HBase命令行操作
2024-07-28 18:44 | 分类:数据库 | 评论:0 次 | 浏览: 41
更改Student表的列族baseInfo的存储版本的限制为3(默认情况下,列族只存储一个版本的数据,如果需要存储多个版本的数据,则需要修改...
【Hbase】Hbase TableInputFormat、TableOutputFormat
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 43
TableInputFormat是Apache HBase中的一个重要的类,它允许MapReduce作业直接从HBase表中读取数据作为其输...
JDK从8升级到11,使用 G1 GC,HBase性能下降20%。JDK 到底干了什么
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 44
结论:使用 G1 GC,JDK 11 相对于 JDK 8 来说性能明显下降。3原因分析=====从 JDK 8 到 JDK 11, G1 G...
大数据基础知识-Hadoop、HBase、Hive一篇搞定
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 39
相应的,数据库由于规模较小,因此可以支持的数据规模较小,一般单张表中能存储百万条数据(最新版的MySQL经过优化,单表中可以存储千万条或者上...
archive
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 37
就拿时间这个变量来说,我们一般认为时间是连续的,它确实是连续的,但是,我们用科学的测量,是没法把时间测成连续的,也就是说,我们哪怕用微秒纳秒...
Hive-存储-文件格式
2024-07-28 18:43 | 分类:数据库 | 评论:0 次 | 浏览: 40
数据存储是Hive的基础,选择合适的底层数据存储格式,可以在不改变Hql的前提下得到大的性能提升。类似mysql选择适合场景的存储引擎。Hi...
【超详细】HIVE 日期函数(当前日期、时间戳转换、前一天日期等)
2024-07-28 18:42 | 分类:数据库 | 评论:0 次 | 浏览: 39
【超详细】HIVE 日期函数(当前日期、时间戳转换、前一天日期等)常量:当前日期、时间戳前一天日期、后一天日期获取日期中的年、季度、月、周、...
大数据Hadoop之——部署hadoop+hive+Mysql环境(Linux)
2024-07-28 18:42 | 分类:数据库 | 评论:0 次 | 浏览: 44
-是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是 true -->--是否启动一个线程检查...
hive报错——FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask
2024-07-28 18:40 | 分类:数据库 | 评论:0 次 | 浏览: 39
执行完报错了:FAILED: Execution Error, return code 1 from org.apache.hadoop.h...
HIve安装配置(超详细)
2024-07-28 18:40 | 分类:数据库 | 评论:0 次 | 浏览: 40
文章目录Hive安装配置一、Hive安装地址二、Hive安装部署1. 把 `apache-hive-3.1.2-bin.tar.gz`上传到...
【AI大模型】赋能儿童安全:楼层与室内定位实践与未来发展
2024-07-28 17:09 | 分类:数据库 | 评论:0 次 | 浏览: 42
人工智能(AI)技术通过模拟人类智能,能够处理复杂的任务,如图像识别、自然语言处理和决策制定等。近年来,AI技术在各个领域的应用都取得了显著...
轻松上手MYSQL:掌握MYSQL聚合函数,数据分析不再难
2024-07-28 16:25 | 分类:数据库 | 评论:0 次 | 浏览: 37
本文介绍了如何通过轻松上手MYSQL并掌握其聚合函数,使数据分析变得简单易行。MYSQL的聚合函数是数据处理与分析的强大工具,能够帮助用户轻...
MySQL如何给查询结果添加行号
2024-07-28 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 41
mysql给查询结果添加行号set @rownum:=0; -- 注意:“:=”表示赋值,“=”表示比较,“@”表示变量 select pr...
使用Canal和Kafka解决MySQL与缓存的数据一致性问题
2024-07-28 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 34
1. 准备工作1. 开启并配置mysql的 binlog(mysql 8.0 默认开启)修改配置:c:\programdata\mysql\...
mysql插入时报错(1366, “Incorrect string value: ‘\xF0\x9F\x91\x8D\xF0\x9F…’ for column...
2024-07-26 20:17 | 分类:数据库 | 评论:0 次 | 浏览: 62
MySQL DELETE速度提高的几种方法
2024-07-26 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 44
提高mysql中delete操作的速度通常涉及多个方面,包括优化查询、索引、表结构、硬件和配置等。以下是一些建议,以及一些示例代码,用于帮助...
mysql之数字函数的具体使用
2024-07-25 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 44
当然,以下是一些常用的 mysql 数学函数的详细介绍和示例,包括调用这些函数后的结果。abs(x)返回x的绝对值。select abs(-...
MySQL(基于GTID方式)实现主从复制和单主复制详细教程
2024-07-25 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 25
前言在分布式数据库系统中,主从复制是实现高可用性和数据冗余的重要手段。基于gtid(global transaction identifie...
MySQL数据库中如何查询近一年的数据
2024-07-25 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 32
前言:在mysql中,如果你想查询近一年的数据,你可以使用curdate()或now()函数来获取当前日期或时间,然后通过日期函数(如dat...
mysql 语句如何优化(mysql查询慢如何解决)
2024-07-24 20:08 | 分类:数据库 | 评论:0 次 | 浏览: 37
MySQL语句的优化是数据库性能调优的重要一环。以下是一些常用的MySQL语句优化方法:
mysql使用force index的问题解决
2024-07-24 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 36
谨慎使用force index,当index不存在或index名改变时,sql会报错简介force index是 mysql 中的一个查询提...
mysql最左前缀法则导致索引失效的解决
2024-07-24 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 35
1. 什么是最左前缀法则最左前缀是在使用innodb存储引擎索引时,需要遵守的法则。在一个联合索引如idx(a, b, c),执行查询sql...
Mysql中NTILE()函数的具体使用
2024-07-24 11:31 | 分类:数据库 | 评论:0 次 | 浏览: 34
窗口函数的基本语法<窗口函数> over ([partition by <用于分组的列>] order by <...