2024年机器学习 -- 初识决策树,web开发教程
2024-08-02 23:03 | 分类:人工智能 | 评论:0 次 | 浏览: 134
D: 训练数据 |D|:样例的总个数K: 总共的类别,Ck分别表示每个类,|Ck|表示每个类对应的个数假设特征A有n个值,则将D划分为{D...
【Hadoop大数据技术】——HDFS分布式文件系统(学习笔记)
2024-08-02 22:45 | 分类:人工智能 | 评论:0 次 | 浏览: 145
在NameNode内部是以元数据的形式,维护着两个文件,分别是FsImage镜像文件和EditLog日志文件。其中,FsImage镜像文件用...
反爬虫限制:有哪些方法可以保护网络爬虫不被限制?
2024-08-02 22:39 | 分类:人工智能 | 评论:0 次 | 浏览: 103
目前,爬虫已经成为互联网数据获取最主流的方式。但为了保证爬虫顺利采集数据,需要防范网站的反爬虫机制,降低IP被限制的风险,这样才能提高爬虫工...
【第八天】DNS及其查询过程
2024-08-02 22:39 | 分类:人工智能 | 评论:0 次 | 浏览: 96
一般我们的主机,服务器都有一个ip地址,例如10.10.10.1。在计算机层面,如果我们要发送请求的话,首先就要知道我们的目标,也就是对方的...
冯诺依曼体系结构与操作系统
2024-08-02 22:38 | 分类:人工智能 | 评论:0 次 | 浏览: 106
当cpu在处理数据的时候,内存预先把数据从外设提取出来,然后等cpu处理完后就不用再漫长等待数据的到来,直接从内存中拷贝到cpu中即可,输出...
【机器学习】浅谈逻辑回归
2024-08-02 22:33 | 分类:人工智能 | 评论:0 次 | 浏览: 132
Logistic回归和Softmax回归都是在采用逻辑回归的思想来解决分类问题。逻辑回归是一种二分类模型,用于解决二分类问题。它通过将输入特...
机器学习:基于逻辑回归和高斯贝叶斯对人口普查数据集的分类与预测
2024-08-02 22:33 | 分类:人工智能 | 评论:0 次 | 浏览: 135
基于逻辑回归和高斯贝叶斯对人口普查数据集的分类与预测
机器学习之线性回归与逻辑回归【完整房价预测和鸢尾花分类代码解释】
2024-08-02 22:33 | 分类:人工智能 | 评论:0 次 | 浏览: 134
机器学习的起源可以追溯到人工智能的发展历程。虽然人工智能的概念早在20世纪50年代就已经出现,但直到之后几十年里,随着计算机技术的不断发展和...
单链表面试题---移除链表元素和翻转链表
2024-08-02 22:28 | 分类:人工智能 | 评论:0 次 | 浏览: 94
分别定义两个指针,分别为cur和prev,让cur=head.next,让prev=head。如下图cur指针是用来确定该节点的数据是否为要...
Zookeeper-快速入门、服务搭建、集群搭建教程
2024-08-02 22:25 | 分类:人工智能 | 评论:0 次 | 浏览: 98
Zookeeper集群中的所有机器通过Leader选举来选定⼀台被称为Leader的机器,Leader服务器为客户端提供读和写服务,除Lea...
如何学习Flink:糙快猛的大数据之路(图文并茂)
2024-08-02 22:20 | 分类:人工智能 | 评论:0 次 | 浏览: 108
在数据的海洋中,Flink 是你的航船。熟悉它,运用它,你将能够驾驭任何数据的风浪。祝你在 Flink 的学习之路上一帆风顺,早日成为独当一...
Hive表统计信息采集及应用
2024-08-02 22:17 | 分类:人工智能 | 评论:0 次 | 浏览: 93
Hive提供了分析表和分区的功能,可以将分析后的统计信息存入元数据中,该功能可以自动执行分析表或手动执行分析表。自动执行分析主要针对新创建的...
ClickHouse 存算分离改造:小红书自研云原生数据仓库实践
2024-08-02 22:17 | 分类:人工智能 | 评论:0 次 | 浏览: 94
REDck 通过云原生架构升级,能够处理万亿级数据规模,实现秒级 OLAP 查询,支持分钟级自动故障恢复、弹性扩缩容能力,成本优化效果显著。
关于数据仓库的一些梳理
2024-08-02 22:17 | 分类:人工智能 | 评论:0 次 | 浏览: 93
主题虽然在信息包图中只占据标题的位置,但是却是信息打包方法中最重要的部分,当主题定义好之后,数据仓库中的逻辑模型也就基本成形了。数据仓库中的...
离线数仓-数据仓库系统
2024-08-02 22:16 | 分类:人工智能 | 评论:0 次 | 浏览: 112
数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。只有将数据有序的组织和存储起来之后,数据才能得到高性能、低成本...
一文详解数据仓库、数据湖、湖仓一体和数据网格
2024-08-02 22:15 | 分类:人工智能 | 评论:0 次 | 浏览: 106
本文对数据仓库、数据湖、湖仓一体、数据网格四个技术概念进行了辨析,并对它们的优势和局限给出了对比介绍。
华清远见-重庆中心-数据库阶段知识点梳理
2024-08-02 22:15 | 分类:人工智能 | 评论:0 次 | 浏览: 101
数据Data需要永久保存到数据库中数据库DB是运行在操作系统上的一个软件数据库管理系统DBMS是管理数据库的一个软件学习数据库就是学习如何使...
什么是数据湖?一文详解数据湖与数据仓库的区别
2024-08-02 22:15 | 分类:人工智能 | 评论:0 次 | 浏览: 103
本文主要探讨了什么是数据仓库和数据湖,辨析了数据仓库和数据湖的区别以及如何快速搭建数据仓库。
从数据仓库到数据湖(上):数据湖导论
2024-08-02 22:15 | 分类:人工智能 | 评论:0 次 | 浏览: 164
在《从数据仓库到数据湖(上):数据湖导论》一文中,详细介绍了数据湖的起源、定义及其与数据库和数据仓库的区别。数据湖由詹姆斯·迪克森于2010...
insert overwrite table:数据仓库和数据分析中的常用技术
2024-08-02 22:14 | 分类:人工智能 | 评论:0 次 | 浏览: 101
"INSERT OVERWRITE TABLE:清空和重新加载表中的数据"
基于Hadoop和Hive的聊天数据(FineBI)可视化分析
2024-08-02 22:11 | 分类:人工智能 | 评论:0 次 | 浏览: 109
Fine BI支持Hadoop Hive数据源,可以直接连接Hive进行数据查询和可视化,且提供多种图表类型,包括折线图、柱状图、饼图等,满...