AI遮天传 ML-初识决策树_ai遮天传 ml-初识决策树_老师我作业忘带了的博客-csdn博客
2024-08-06 01:54 | 分类:人工智能 | 评论:0 次 | 浏览: 114
表示所有不相同情况的乘积(如果是A、B两种情况则p(A)*p(B),如果是A、B、C三种情况则p(A)*p(B)+p(A)*p©+p(B)*...
【深度学习】决策树的引入与应用
2024-08-06 01:52 | 分类:人工智能 | 评论:0 次 | 浏览: 118
在线性模型中,对于一个拥有i个属性的数据集我们通过构造yWXWwb∗Xx1;x2;...;xi根据均方方差最小化或者对数几率最大化来进...
图像去重技术:MD5哈希在自动化中的应用
2024-08-06 01:35 | 分类:人工智能 | 评论:0 次 | 浏览: 111
MD5(Message Digest Algorithm 5)是一种广泛使用的哈希函数,它可以产生一个128位(16字节)的哈希值,通常用一...
分布式文件系统的性能优化:HDFS和GlusterFS的实现
2024-08-06 01:26 | 分类:人工智能 | 评论:0 次 | 浏览: 119
1.背景介绍分布式文件系统(Distributed File System, DFS)是一种在多个计算节点上存储数据,并提供统一文件系统接口...
图论 - DFS深度优先遍历、BFS广度优先遍历、拓扑排序
2024-08-06 01:25 | 分类:人工智能 | 评论:0 次 | 浏览: 115
本篇博客将介绍DFS-深度优先遍历、BFS-广度优先遍历和拓扑排序的常见题型(模板题及其扩展)。DFS和BFS是遍历图的两种方法,其中BFS...
热数据存储在HDFS,冷备数据存储于对象存储中
2024-08-06 01:25 | 分类:人工智能 | 评论:0 次 | 浏览: 119
将日常常用热数据采用HDFS存储(存储时间2~3个月),超过该时间段数据采用对象存储。改方案均采用同一套Hadoop架构,使用hive均可以...
机器学习个人作业:回归分析
2024-08-06 01:03 | 分类:人工智能 | 评论:0 次 | 浏览: 350
本作业计划利用机器学习多元回归模型对伦敦地区2018年和2019年共享单车在不同季节和环境下的使用次数进行分析,尝试寻找出影响单车使用情况的...
随机森林、逻辑回归、多层感知机和极端梯度提升(XGBoost)是四种常见的机器学习模型-代码模型评价可视化
2024-08-06 01:02 | 分类:人工智能 | 评论:0 次 | 浏览: 411
个人租房
机器学习——逻辑回归
2024-08-06 01:02 | 分类:人工智能 | 评论:0 次 | 浏览: 426
目录一. 逻辑回归(Logistic Regression)二. 逻辑回归模型的算法原理1. 处理数据2. 引入sigmoid函数3. 引...
逻辑回归
2024-08-06 01:02 | 分类:人工智能 | 评论:0 次 | 浏览: 410
逻辑回归是通过回归的思想来解决二分类问题的算法。逻辑回归是将样本特征和样本所属类别的概率联系在一起。假设现在已经训练好了一个逻辑回归的模型为...
机器学习:逻辑回归
2024-08-06 01:01 | 分类:人工智能 | 评论:0 次 | 浏览: 411
逻辑回归的概念以及损失函数推导过程,广义线性分布的概念和公式,loss函数图像化展示,附带代码。
【人工智能】逻辑回归(二)
2024-08-06 01:00 | 分类:人工智能 | 评论:0 次 | 浏览: 115
一、读取ex2data1.txt中的数据,建立样本集,使用逻辑回归算法得到参数估计值。并在坐标图中画出分界图。1. 读取数据2. 画散点图3...
基于Doris的日志存储分析平台(同步Kafka日志数据)
2024-08-06 00:47 | 分类:人工智能 | 评论:0 次 | 浏览: 101
【代码】基于Doris的日志存储分析平台(同步Kafka日志数据)
zookeeper+kafka消息队列群集部署
2024-08-06 00:44 | 分类:人工智能 | 评论:0 次 | 浏览: 113
消息(Message)是指在应用间传送的数据。消息可以非常简单,比如只包含文本字符串,也可以更复杂,可能包含嵌入对象。消息队列(Messag...
Flink状态State | 大数据技术
2024-08-06 00:35 | 分类:人工智能 | 评论:0 次 | 浏览: 104
在 Flink 中,状态是流处理程序中非常重要的一部分,它允许你保存和访问数据,以实现复杂的计算逻辑。可以简单理解为:历史计算结果
ClickHouse 与 Flink 整合:流处理与时间序列分析
2024-08-06 00:35 | 分类:人工智能 | 评论:0 次 | 浏览: 319
1.背景介绍时间序列数据是指以时间为维度、数值为值的数据,是目前互联网、物联网、金融、制造业等各个领域中最为重要的数据类型之一。随着大数据技...
Flink Kafka[输入/输出] Connector
2024-08-06 00:35 | 分类:人工智能 | 评论:0 次 | 浏览: 132
本章重点介绍生产环境中最常用到的。使用Flink的同学,一定会很熟悉kafka,它是一个分布式的、分区的、多副本的、 支持高吞吐的、发布订阅...
IT学习笔记--Flink
2024-08-06 00:34 | 分类:人工智能 | 评论:0 次 | 浏览: 121
Data Sources 就字面意思其实就可以知道:数据来源。Flink做为一款流式计算框架,它可用来做批处理,即处理静态的数据集、历史的数...
hive中使用iceberg表格式时锁表总结
2024-08-06 00:30 | 分类:人工智能 | 评论:0 次 | 浏览: 117
1. 原因写入iceberg表时,会在hive_locks表中插入一条记录,表示该表正在被写入(hive中的独占锁)当数据插入完成后,会自动...
耗时n年,38页《数据仓库知识体系
2024-08-06 00:30 | 分类:人工智能 | 评论:0 次 | 浏览: 111
元数据管理是对基础库和主题库中的数据项属性的管理,同时,将数据项的业务含义与数据项进行了关联,便于业务人员也能够理解数据库中的数据字段含义,...
超详细【入门精讲】数据仓库原理&实战 一步一步搭建数据仓库 内附相应实验代码和镜像数据和脚本
2024-08-06 00:29 | 分类:人工智能 | 评论:0 次 | 浏览: 114
超详细【入门精讲】数据仓库原理&实战 一步一步搭建数据仓库 内附相应实验代码和镜像数据和脚本,参考B站up主哈喽鹏程视频撰写而成,感...
数据仓库【分层设计】
2024-08-06 00:27 | 分类:人工智能 | 评论:0 次 | 浏览: 115
数据仓库,通过数仓建模更好的组织管理和存储数据,以便在性能、成本、效率和质量之间取得最好的平衡。