avl树
二叉树在数据有序时,会变成单链表,使得搜索效率极大的降低,为了维持二叉树的搜索特性,使得整体保持平衡,从而诞生二叉搜索树
avl树的插入&旋转&验证
public class avltree {
public static void main(string[] args) {
avltree avltree = new avltree();
int[] arr = {4, 2, 6, 1, 3, 5, 15, 7, 16,14};
for (int i = 0; i < arr.length; i++) {
avltree.insert(arr[i]);
}
system.out.println(isbalanced(root));
}
public class treenode {
public int val;
public treenode left;
public treenode right;
public treenode parent;
public int balancefactor;
public treenode(int val) {
this.val = val;
}
}
public static treenode root;
public boolean insert(int val) {
treenode ntreenode = new treenode(val);
//前部分是二叉树的插入
if (root == null) {
root = ntreenode;
return true;
}
treenode curnode = ntreenode;
treenode prevnode = null;
while (curnode != null) {
prevnode = curnode;
if (ntreenode.val > curnode.val) {
curnode = curnode.left;
} else if (ntreenode.val < curnode.val) {
curnode = curnode.right;
} else {
return false;
}
}
//判断位置
if (ntreenode.val > prevnode.val) {
prevnode.right = ntreenode;
} else {
prevnode.left = ntreenode;
}
//修改平衡因子
while (prevnode != null) {
curnode = ntreenode;
prevnode = curnode.parent;
if (prevnode.right == curnode) {
prevnode.balancefactor++;
} else {
prevnode.balancefactor--;
}
if (prevnode.balancefactor == 0) {
//平衡因子为0,树的高度没有发生变化,不影响上面树的平衡因子
return true;
} else if (prevnode.balancefactor == -1 || prevnode.balancefactor == 1) {
} else {
if (prevnode.balancefactor == 2) {
if (curnode.balancefactor == 1) {
leftrotation(prevnode);
} else {
lrrotation(prevnode);
}
} else {
//prevnode.balancefactor == -2
if (curnode.balancefactor == 1) {
rlrotation(prevnode);
} else {
rightrotation(prevnode);
}
}
break;
}
}
return true;
}
private void rlrotation(treenode prevnode) {
treenode rnode = prevnode.right;
treenode rlnode = rnode.left;
int bf = rlnode.balancefactor;
rightrotation(rnode);
leftrotation(prevnode);
if (bf == 1) {
prevnode.balancefactor = -1;
rnode.balancefactor = 0;
rlnode.balancefactor = 0;
} else if (bf == -1) {
prevnode.balancefactor = 0;
rlnode.balancefactor = 0;
rnode.balancefactor = 1;
}
}
private void lrrotation(treenode prevnode) {
treenode lnode = prevnode.left;
treenode lrnode = lnode.right;
int bf = lrnode.balancefactor;
leftrotation(lnode);
rightrotation(prevnode);
if (bf == 1) {
prevnode.balancefactor = 0;
lrnode.balancefactor = 0;
lnode.balancefactor = -1;
} else if (bf == -1) {
prevnode.balancefactor = 1;
lnode.balancefactor = 0;
lrnode.balancefactor = 0;
}
}
private static void leftrotation(treenode parent) {
treenode rpaernt = parent.right;
treenode rlparent = parent.right.left;
treenode ppaernt = parent.parent;
parent.parent = rpaernt;
parent.right = rlparent;
if (rlparent != null) {
rlparent.parent = parent;
}
rpaernt.left = parent;
//判断是不是根结点
if (parent == root) {
root = rpaernt;
root.parent = null;
} else {
if (rpaernt.val < ppaernt.val) {
ppaernt.left = rpaernt;
} else {
ppaernt.right = rpaernt;
}
}
rlparent.balancefactor = 0;
parent.balancefactor = 0;
}
private static void rightrotation(treenode parent) {
treenode lrparent = parent.left.right;
treenode lparent = parent.left;
treenode pparent = parent.parent;
lparent.right = parent;
parent.left = lrparent;
parent.parent = lparent;
if (lrparent != null) {
lrparent.parent = parent;
}
//判断是不是根结点
if (parent == root) {
root = lparent;
root.parent = null;
} else {
//不是根结点就判断是左子树还是右子树
if (pparent.val > lparent.val) {
pparent.left = lparent;
} else {
pparent.right = lparent;
}
}
lparent.balancefactor = 0;
pparent.balancefactor = 0;
}
/**
* 中序遍历
*/
public static void inordertree(treenode root) {
if (root == null) {
return;
}
inordertree(root.left);
system.out.print(root.val + " ");
inordertree(root.right);
}
private static int getheight(treenode node) {
if (node == null) {
return 0;
}
int lefth = getheight(node.left);
int righth = getheight(node.right);
return lefth > righth ? lefth + 1 : righth + 1;
}
public static boolean isbalanced(treenode root) {
if (root == null) return true;
int lefth = getheight(root.left);
int righth = getheight(root.right);
if (righth - lefth != root.balancefactor) {
return false;
}
return math.abs(root.balancefactor) <= 1
&& isbalanced(root.left)
&& isbalanced(root.right);
}
}
性能分析
avl树对于静态数据来说,查找效率极高,但对于需要频繁修改的数据来说则效率并不理想,因为avl的高效是为了保持平衡而旋转付出的代价
红黑树
特点
红黑树中结点的非黑及红
不存在两个连续的红色结点(黑色可以)
最长路径不能大于最短路径的两倍
根结点是黑色的
一个结点向下延伸的每条路径中黑色结点的是相同的
每个叶子结点都是黑色的,且都是空结点
红黑树是为了保持相对平衡,而不是像avl树一样保持绝对平衡
如果黑色节点是x个,因为根结点是黑色的,且根结点到每个叶子节点的黑色节点数量相同,红色节点的子节点必是两个黑色节点,则红色节点最多x-1个,考虑最短路径纯黑色节点和最长路径红色以最多的形式在路径插入,查找的时间复杂度都是logn
红黑树节点初始化的时候把颜色设置为红色,因为当你插入一个颜色为黑色时,又需要保持各个路径黑色节点数目相同,就会增加多余的节点或者进行更复杂的调整,如果初始化为红色,则会较黑色节点减少复杂程度和开销
红黑树插入实现
public class rbtree {
public static void main(string[] args) {
rbtree rbtree = new rbtree();
int[] arr = {4, 2, 6, 1, 3, 5, 15, 7, 16,14};
for (int i = 0; i < arr.length; i++) {
rbtree.insert(arr[i]);
}
system.out.println(isrbtree(root));
inorder(root);
}
static class rbtreenode {
public int val;
public rbtreenode left;
public rbtreenode right;
public rbtreenode parent;
public color color;
public rbtreenode(int val) {
this.val = val;
this.color = color.red;
}
}
static rbtreenode root;
public static boolean insert(int val) {
rbtreenode node = new rbtreenode(val);
if (root == null) {
root = node;
root.color = color.black;
return true;
}
rbtreenode cur = root;
rbtreenode prev = null;
while (cur != null) {
prev = cur;
if (cur.val > val) {
cur = cur.left;
} else if (cur.val < val) {
cur = cur.right;
} else {
system.out.println("已存在,无法存入");
return false;
}
}
if (val > prev.val) {
prev.right = node;
} else {
prev.left = node;
}
node.parent = prev;
cur = node;
//进行颜色调整
while (prev != null && prev.color == color.red) {
//prev节点是红色,必存在祖父节点
rbtreenode grandfather = prev.parent;
if (prev == grandfather.left) {
rbtreenode uncle = grandfather.right;
if (uncle != null && uncle.color == color.red) {
prev.color = color.black;
uncle.color = color.black;
grandfather.color = color.red;
cur = grandfather;
prev = cur.parent;
} else {
//叔叔节点为空或者叔叔节点的颜色是黑色
//右旋
if (cur == prev.right) {
left(prev);
rbtreenode tmp = cur;
cur = prev;
prev = tmp;
}
right(grandfather);
grandfather.color = color.red;
prev.color = color.black;
}
} else {
rbtreenode uncle = grandfather.left;
if (uncle != null && uncle.color == color.red) {
prev.color = color.black;
uncle.color = color.black;
grandfather.color = color.red;
cur = grandfather;
prev = cur.parent;
} else {
//叔叔节点为空或者叔叔节点的颜色是黑色
//右旋
if (cur == prev.left) {
right(prev);
rbtreenode tmp = cur;
cur = prev;
prev = tmp;
}
left(grandfather);
grandfather.color = color.red;
prev.color = color.black;
}
}
}
root.color = color.black;
return true;
}
public static void inorder(rbtreenode root) {
if(root==null) {
return;
}
inorder(root.left);
system.out.print(root.val+" ");
inorder(root.right);
}
private static void left(rbtreenode node) {
rbtreenode rnode = node.right;
rbtreenode rlnode = rnode.left;
rbtreenode ppnode = node.parent;
rnode.left = node;
node.right = rlnode;
node.parent = rnode;
if (rlnode != null) {
rlnode.parent = node;
}
//是不是根结点
if (node == root) {
//是根节点
root = rnode;
rnode.parent = null;
} else {
if (ppnode.left == node) {
ppnode.left = rnode;
} else {
ppnode.right = rnode;
}
rnode.parent = ppnode;
}
}
private static void right(rbtreenode node) {
rbtreenode lnode = node.left;
rbtreenode lrnode = lnode.right;
rbtreenode ppnode = node.parent;
lnode.right = node;
node.left = lrnode;
node.parent = lnode;
if (lrnode != null) {
lrnode.parent = node;
}
//是不是根结点
if (node == root) {
//是根节点
root = lnode;
lnode.parent = null;
} else {
if (ppnode.left == node) {
ppnode.left = lnode;
} else {
ppnode.right = lnode;
}
lnode.parent = ppnode;
}
}
public static boolean isrbtree(rbtreenode root) {
if (root == null) {
return true;
}
if(root.color!=color.black) {
system.out.println("违反性质: 根结点的颜色是黑色");
return false;
}
//判断是否存在连续红色节点,可以根据每个红色节点是否有父红色节点来判断
if (!isred(root)) {
system.out.println("违法了性质: 红黑树不存在两个连续的红色节点");
return false;
}
int blacknum = 0;
rbtreenode cur = root;
while (cur != null) {
if (cur.color == color.black) {
blacknum++;
}
cur = cur.left;
}
int pathnum = 0;
if (!blacknum(root, blacknum, pathnum)) {
system.out.println("违反性质: 每条路径的黑色节点数目相同");
return false;
}
return true;
}
private static boolean blacknum(rbtreenode root, int blacknum, int pathnum) {
if (root == null) {
return true;
}
if (root.color == color.black) {
pathnum++;
}
if (root.left == null && root.right == null ) {
if(pathnum != blacknum) {
system.out.println(root.val);
return false;
}
}
return blacknum(root.left, blacknum, pathnum) && blacknum(root.right, blacknum, pathnum);
}
private static boolean isred(rbtreenode root) {
if (root == null) {
return true;
}
if (root.color == color.red && root.parent.color == color.red) {
return false;
}
return isred(root.left) && isred(root.right);
}
}
位图
位图是为了在海量数据中,整数且无重复的场景进行对某个数据存在的判断
实现
public class bitmap {
byte[] elements;
int usedsize;
public bitmap(int num) {
elements = new byte[num / 8 + 1];
}
public void insert(int val) {
if (val < 0) {
throw new arrayindexoutofboundsexception();
}
int byteindex = val / 8;
while (byteindex > elements.length - 1) {
elements = arrays.copyof(elements, elements.length + 1);
}
int bitindex = val % 8;
elements[byteindex] |= (1 << bitindex);
usedsize++;
}
public boolean get(int val) {
if (val < 0) {
throw new arrayindexoutofboundsexception();
}
int byteindex = val / 8;
if (byteindex > elements.length - 1) {
system.out.println("坐标越界违法");
return false;
}
int bitindex = val % 8;
if (((elements[byteindex]) & (1 << bitindex)) != 0) {
return true;
}
return false;
}
public void reset(int val) {
if (val < 0) {
throw new arrayindexoutofboundsexception();
}
int byteindex = val / 8;
if (byteindex > elements.length - 1) {
system.out.println("坐标越界违法");
return;
}
int bitindex = val % 8;
elements[byteindex] &= ~(1<<bitindex);
usedsize--;
}
public int getusedsize() {
return usedsize;
}
}
布隆过滤器
布隆过滤器是判断某样东西一定不存在或者可能存在,布隆过滤器是位图和多个哈希函数的结合,使用哈希函数就存在哈希碰撞,在一个元素插入的时候,使用位图多个位置来标记,难免后面出现元素会与其中一个位置或者多个位置重合,但是如果当元素判断的几个位置标记中有一个为0,那么就肯定不存在,而且对于布隆过滤器来说是不可以删除的,因为其中一个元素的删除,其中与之重合位置的其他元素会被认为不存在
实现
package bloomfilter;
import java.util.bitset;
class simplehash {
public int cap;//容量
public int rand;//随机种子
public simplehash(int cap, int rand) {
this.cap = cap;
this.rand = rand;
}
/**
* 哈希函数
*
* @param s 根据字符串返回一个哈希值
* @return
*/
int hash(string s) {
int res = 0;
for (int i = 0; i < s.length(); i++) {
res = res * rand + s.charat(i);
}
return res & (cap - 1);
}
}
public class bloomfilter {
public static void main(string[] args) {
bloomfilter b = new bloomfilter();
b.add("www");
b.add("aaa");
b.add("acb");
b.add("abc");
system.out.println(b.contains("abc"));
}
private static int default_size;
bitset bitset;
public int usedsize;//存储的个数
public int[] rad = {1, 3, 7, 13, 26, 74};//随机种子
simplehash[] simplehashes;
public bloomfilter() {
bitset = new bitset(default_size);
simplehashes = new simplehash[rad.length];
//根据每个随机种子生成对应的哈希函数
for (int i = 0; i < rad.length; i++) {
simplehashes[i] = new simplehash(default_size, rad[i]);
}
}
public void add(string s) {
for (int i = 0; i < simplehashes.length; i++) {
bitset.set(simplehashes[i].hash(s));
}
usedsize++;
}
public boolean contains(string s) {
for (int i = 0; i < simplehashes.length; i++) {
if (!bitset.get(simplehashes[i].hash(s))) {
return false;
}
}
return true;
}
}
优点:
对于数据量庞大时,可以对数据全量进行存储
时间复杂度取决于哈希函数的个数,与数据量无关
极大的节省空间
缺点:
对数据容易产生误判,但是可以确定一定不存在的数据
不支持删除操作
无法获取元素
海量数据问题
1. 对于一个100多g的文件,存放着ip,如何知道出现次数最多的ip?
首先不能使用<k,v>结构,因为数据太大,内存存不下,那我们就要对文件进行细分
但是不能均分来分别统计小文件中的最大值,因为ip随机分布,且小文件的最大值并不能代表大文件的最大值
我们可以分出200份小文件,大小0.5g,然后对大文件进行遍历,将大文件的ip通过哈希函数得到对应的下标,写入对应的文件,每个文件存储相同的ip,最后使用map统计每个小文件ip出现的次数进行比较得到对应的ip
2. 给定100亿个整数,设计算法找到只出现一次的整数?
(1)采用刚才的方法,进行哈希切割,创建足够数量的小文件,使用哈希函数来放入,最后统计出现一次的整数
(2)也可以采用两个位图的方法进行,对一个数据出现次数的不同对两个位图相应位置进行调整,比如出现一次第一个位图表示0,第二个位图表示1,表示01;出现两次后,把第一个位图改为1,第二个位图改为0,表示10,以此类推
(3)或者可以使用一个位图,但是你要用两个位来表示.一个数据用以统计出现次数
3. 给两个文件,分别有100亿个整数,我们只有1g内存,如何找到两个文件交集?
(1)采用哈希分割,两个文件分别采用哈希函数写入各自的几百个小文件,然后因为采用相同的哈希函数,下标相同的文件中对于相同的数字建立一个大文件接收
(2)使用位图,先将一个文件放在位图里,然后遍历另一个文件,对于b文件中出现的可以在a文件中找到就放到一个新的大文件来储存
(3)仍是采用位图,将两个文件分别存入不同的位图,使用按位与运算得到交集,同样的,采用这个方法还可以通过按位或运算得到并集,通过按位异或得到差集
4. 位图应用变形:1个文件有100亿个int,1g内存,设计算法找到出现次数不超过2次的所有整数
(1) 采用哈希切割
(2) 使用两个位图,标记次数,00,01,10,11
5. 给两个文件,分别有100亿个query,我们只有1g内存,如何找到两个文件交集?分别给出精确算法和近似算法
(1) 采用哈希切割,对于两个文件分别建立足够数量恰当大小的小文件,通过哈希函数分别将query存储到对于小文件,然后最后对于下标相同的小文件进行查找合并交集
(2) 使用布隆过滤器,将第一个文件放到布隆过滤器,然后对第二个文件中出现的数据去布隆过滤器查找,但是布隆过滤器存在误判,不能准确判断
一堆数据要存放到多个服务器,如果使用一般哈希函数取余服务器的数量,就会导致增加服务器或者服务器崩溃时,原来在缓存中的数据一时间无法对映,会使数据访问压力剧增,可能会宕机
基于上述情况,可以采用一致性哈希解决,采用环形哈希,将服务器分布在哈希环上,数据的哈希函数会使得数据在哈希环上分布,顺时针缓存到遇到的第一个服务器,但是理想情况下是服务器分布分散,使得数据在各个服务器分布均匀,但是如果服务器分布集中就可能会使大量数据存储在一个服务器而使服务器压力很大
为了解决服务器在哈希环上分布不均匀的问题,就引入虚拟节点,使得服务器尽量均匀,每个虚拟节点对应一个服务器
并查集
并查集可以将数据进行划分不同的集合,并可以合并集合
实现并查集
import java.util.arrays;
public class unionfindset {
int[] array;
public unionfindset(int num) {
array = new int[num];
//初始化为-1
arrays.fill(array, -1);
}
/**
* 判断两个元素是不是同一个集合
*
* @param a
* @param b
* @return
*/
public boolean issamefindset(int a, int b) {
return findroot(a) == findroot(b);
}
/**
* 查找元素根结点
*
* @param a
* @return 返回根结点下标
*/
private int findroot(int a) {
//如果下标负数,则违法抛出异常
if (a < 0) {
throw new arrayindexoutofboundsexception();
}
while (array[a] >= 0) {
a = array[a];
}
return a;
}
/**
* 合并集合
*
* @param x1
* @param x2
*/
public boolean union(int x1, int x2) {
//合并两个数要合并根结点
//先要判断是不是同一集合
int root1 = findroot(x1);
int root2 = findroot(x2);
if (root1 == root2) {
system.out.println("属于同一集合,不需要合并");
return false;
}
array[root1] += array[root2];
array[root2] = root1;
return true;
}
/**
* 得到数据中有集合个数
*
* @return
*/
public int getset() {
int count = 0;
for (int x : array) {
if (x < 0) {
count++;
}
}
return count;
}
public void print() {
for (int i = 0; i < array.length; i++) {
system.out.print(array[i]+" ");
}
system.out.println();
}
}
如果把true改为false就会是
如果使用false,打印的顺序是插入顺序,使用true的话,就会结合访问顺序,每次访问一个元素,会放置尾部,容量满且需要插入时,就会从头部删除
实现lrucache
import java.util.hashmap;
public class lrucache {
static class dlinknode {
int key;
int value;
dlinknode prev;
dlinknode next;
public dlinknode(int key, int value) {
this.key = key;
this.value = value;
}
public dlinknode() {
}
}
public dlinknode head;//头结点
public dlinknode tail;//尾节点
public int capacity;//容量
public int usedsize;
hashmap<integer, dlinknode> map = new hashmap<>();
public lrucache(int capacity) {
head = new dlinknode();
tail = new dlinknode();
head.next = tail;
tail.prev = head;
this.capacity = capacity;
}
public void put(int key, int value) {
dlinknode node = map.get(key);
//不存在该元素
if (node == null) {
//创建新的节点
dlinknode newnode = new dlinknode(key, value);
map.put(key, newnode);
//尾插
inserttail(newnode);
usedsize++;
//检查是否元素填满
if (usedsize > capacity) {
//头删
int headkey = deletehead().key;
map.remove(headkey);
usedsize--;
}
} else {
//存在该元素
node.value = value;
//删除该元素
deletenode(node);
//尾插元素
inserttail(node);
}
}
private dlinknode deletehead() {
dlinknode del = head.next;
head.next = del.next;
del.next.prev = head;
return del;
}
public int get(int key) {
dlinknode node = map.get(key);
if (node == null) {
//不存在
return -1;
}
deletenode(node);
inserttail(node);
return node.value;
}
private void deletenode(dlinknode node) {
node.prev.next = node.next;
node.next.prev = node.prev;
}
private void inserttail(dlinknode newnode) {
dlinknode tmpnode = tail.prev;
tail.prev = newnode;
newnode.next = tail;
newnode.prev = tmpnode;
tmpnode.next = newnode;
}
private void print() {
dlinknode cur = head.next;
while (cur != tail) {
system.out.print(cur.value + " ");
cur = cur.next;
}
system.out.println();
}
public static void main(string[] args) {
lrucache lrucache = new lrucache(3);
lrucache.put(100, 10);
lrucache.put(110, 11);
lrucache.put(120, 12);
system.out.println("获取元素");
lrucache.print();
system.out.println(lrucache.get(110));
lrucache.print();
system.out.println(lrucache.get(100));
lrucache.print();
system.out.println("存放元素,会删除头节点,因为头节点是最近最少使用的: ");
lrucache.print();
lrucache.put(999, 99);
lrucache.print();
}
}
b-树
当数据量非常大时,对文件进行搜索,无法将数据都加载到内存,我们使用平衡二叉树,节点存储搜索有关的数据量和原数据的地址,搜索最差效率与树的高度有关,而且当你要搜索的数据量大时,节点内存无法存储,需要多次io进行
所以我们可以从提高io效率和减少树的高度来提高搜索的效率
数据存储到hashmap和存储到文件中,有什么区别?
1. hashmap存储在内存中,读取速度快
2. hashmap数据因为存储到内存中,所以断电丢失
m叉树的孩子节点m个,存储m-1个数据,但是为了后面分裂的方便,我们将多添加一个孩子节点和一个数据,那么就是m+1个孩子,存储m个数据,因为我们判断分裂的条件是当要插入数据时,存储数据个数等于m-1个数据,就需要进行分裂,但是因为你加上原来要插入的数据是m个,但是节点只能存储m-1,这就需要我们对于中间节点进行分类讨论判断,如果你多添加一个数据,就会多留出一个位置用于排序,直接对中间和两边的数据进行分裂即可
总结:
m叉树
1. 根结点关键字的数量范围[1,m-1],孩子节点的数量[2,m]
2. 非根结点关键字的数量范围[m/2-1,m-1],孩子节点数量[m/2,m];
3. 孩子节点的数量总是比关键字数量多1
b树满的时候会进行分裂,新节点和老节点在同一层,根结点分裂会增加树的高度,b树是天然平衡的
b-树插入实现
public class btree {
class btreenode {
int[] keys;
int usedsize;
btreenode[] childs;
btreenode parent;
public btreenode() {
keys = new int[m];
childs = new btreenode[m + 1];
}
}
public static final int m = 3;
btreenode root;
public boolean insert(int val) {
//b树为空,直接插入
if (root == null) {
root = new btreenode();
root.keys[0] = val;
root.usedsize++;
return true;
}
//b树不为空
//判断树里有没有这个值
pair<btreenode, integer> pair = findval(val);
//根据value值判断这个值是不是在树中
if (pair.getvalue() != -1) {
//等于-1,不存在该值
//不等于,存在该值
//存在该值无法进行插入,退出返回false
return false;
}
btreenode parent = pair.getkey();
//进行插入
int index = parent.usedsize - 1;
while (index >= 0) {
if (val < parent.keys[index]) {
parent.keys[index + 1] = parent.keys[index];
} else {
//大于情况,等于已经在find判断过了
break;
}
index--;
}
parent.keys[index + 1] = val;
parent.usedsize++;
if (parent.usedsize >= m) {
split(parent);
}
return true;
}
/**
* 表示当前要分裂的节点
*
* @param snode
*/
private void split(btreenode snode) {
btreenode newnode = new btreenode();
btreenode psnode = snode.parent;
//分裂节点的父节点
//对分裂节点区域进行划分
int i = 0;
int mid = snode.usedsize / 2;
int j = mid + 1;
while (j < snode.usedsize) {
newnode.keys[i] = snode.keys[j];
newnode.childs[i] = snode.childs[j];
//分裂节点孩子节点在转移的时候要修改他们的父结点
if (snode.childs[i] != null) {
snode.childs[i].parent = newnode;
}
j++;
i++;
}
//将最后一个孩子节点记录下来,重复一次
newnode.childs[i] = snode.childs[j];
if (snode.childs[i] != null) {
snode.childs[i].parent = newnode;
}
newnode.usedsize = i;
//更新原来节点的有效数据数量
//减去右侧数据的数量,再减去中间数据,因为中间数据要被提到分裂节点的父结点中去
snode.usedsize = snode.usedsize - i - 1;
//更新新节点的父亲节点和有效数据数量
if (snode == root) {
root = new btreenode();
root.keys[0] = snode.keys[mid];
root.childs[0] = snode;
root.childs[1] = newnode;
snode.parent = root;
newnode.parent = root;
root.usedsize = 1;
return;
}
newnode.parent = psnode;
//将分裂节点的中间值提到父亲节点
int findexend = psnode.usedsize - 1;
//中间值
int midvalue = snode.keys[mid];
while (findexend >= 0) {
if (snode.parent.keys[findexend] > midvalue) {
snode.parent.keys[findexend + 1] = snode.parent.keys[findexend];
snode.parent.childs[findexend + 2] = snode.parent.childs[findexend + 1];
} else {
break;
}
findexend--;
}
psnode.keys[findexend + 1] = midvalue;
psnode.childs[findexend + 2] = newnode;
psnode.usedsize++;
if (psnode.usedsize >= m) {
split(psnode);
}
}
private pair<btreenode, integer> findval(int val) {
btreenode cur = root;
btreenode parent = null;
while (cur != null) {
int i = 0;
while (i < cur.usedsize) {
if (cur.keys[i] == val) {
return new pair<>(cur, i);
} else if (cur.keys[i] < val) {
i++;
} else {
break;
}
}
parent = cur;
cur = cur.childs[i];
}
return new pair<>(parent, -1);
}
public static void main(string[] args) {
btree mybtree = new btree();
int[] array = {53, 139, 75, 49, 145, 36,101};
for (int i = 0; i < array.length; i++) {
mybtree.insert(array[i]);
}
system.out.println("fdsafafa");
mybtree.inorder(mybtree.root);
}
private void inorder(btreenode root){
if(root == null)
return;
for(int i = 0; i < root.usedsize; ++i){
inorder(root.childs[i]);
system.out.println(root.keys[i]);
}
inorder(root.childs[root.usedsize]);
}
}
b+树
b+树特点:
使用b+树搜索数据一定要遍历整个树的高度,b树不一定
对于<k,v>结构而言,非叶子节点存储k值,叶子节点存储k,v值
内存读取速度快,硬盘速度相较于较慢,从硬盘读取数据到内存,但是硬盘读取太慢了,内存的高速就无法发挥用处,需要使用缓存,让硬盘一次性读取很多数据,然后内存再从缓存中读取,减少io次数,提高效率
图
图是由顶点集合和顶点关系组成的一种数据结构
图包括有向图和无向图
无向图边的条数到达n*(n-1)/2时,称为无向完全图,有向图则是达到n*(n-1)为有向完全图
树是一种特殊的图,图不一定是树
无向图的邻接矩阵是沿着对角线对称的,有向图不一定
邻接矩阵
import java.util.arrays;
/**
* 邻接矩阵
*/
public class graphbymatrix {
private char[] arrayv;//顶点数组
private int[][] matrix;
private boolean isdirect;
/**
* @param size 顶点个数
* @param direct 是否是有向图
*/
public graphbymatrix(int size, boolean direct) {
arrayv = new char[size];
matrix = new int[size][size];
//使得二维数组矩阵用无穷大来进行初始化
for (int i = 0; i < matrix.length; i++) {
arrays.fill(matrix[i], integer.max_value);
}
this.isdirect = direct;
}
public void initarrayv(char[] array) {
for (int i = 0; i < arrayv.length; i++) {
arrayv[i] = array[i];
}
}
/**
* @param srcv 起点
* @param destv 终点
* @param weight 权重
*/
public void addedge(char srcv, char destv, int weight) {
int srcvindex = getindexofv(srcv);
int destvindex = getindexofv(destv);
matrix[srcvindex][destvindex] = weight;
//判断是不是无向图
//因为无向图的邻接矩阵对称
if (!isdirect) {
matrix[destvindex][srcvindex] = weight;
}
}
private int getindexofv(char v) {
for (int i = 0; i < arrayv[i]; i++) {
if (v == arrayv[i]) {
return i;
}
}
return -1;
}
public void printgraph() {
for (int i = 0; i < arrayv.length; i++) {
system.out.print(arrayv[i] + " ");
}
system.out.println();
for (int i = 0; i < matrix.length; i++) {
for (int j = 0; j < matrix[i].length; j++) {
if (matrix[i][j] == integer.max_value) {
system.out.print("∞ ");
} else {
system.out.print(matrix[i][j] + " ");
}
}
system.out.println();
}
}
/**
* 获取顶点的度
*
* @param v
* @return
*/
public int getdevofv(char v) {
int count = 0;
int index = getindexofv(v);
for (int i = 0; i < matrix[index].length; i++) {
if (matrix[index][i] != integer.max_value) {
count++;
}
}
//判断是不是有向图,有向图顶点的度包括入度和出度
if (isdirect) {
for (int i = 0; i < matrix.length; i++) {
if (matrix[i][index] != integer.max_value) {
count++;
}
}
}
return count;
}
public static void main(string[] args) {
graphbymatrix graph = new graphbymatrix(4, true);
char[] array = {'a', 'b', 'c', 'd'};
graph.initarrayv(array);
graph.addedge('a', 'b', 1);
graph.addedge('a', 'd', 1);
graph.addedge('b', 'a', 1);
graph.addedge('b', 'c', 1);
graph.addedge('c', 'b', 1);
graph.addedge('c', 'd', 1);
graph.addedge('d', 'a', 1);
graph.addedge('d', 'c', 1);
system.out.println();
graph.printgraph();
system.out.println(graph.getdevofv('a'));
}
}
邻接表
import java.util.arraylist;
public class graphbynode {
static class node {
public int src;//起点
public int dest;//终点
public int weight;//权重
public node next;
public node(int src, int dest, int weight) {
this.src = src;
this.dest = dest;
this.weight = weight;
}
}
public char[] arrayv;
public arraylist<node> edglist;//存储边
public boolean isdirect;
public graphbynode(boolean isdirect, int size) {
this.arrayv = new char[size];
edglist = new arraylist<>(size);
for (int i = 0; i < size; i++) {
edglist.add(null);
}
this.isdirect = isdirect;
}
public void initarrayv(char[] array) {
for (int i = 0; i < array.length; i++) {
arrayv[i] = array[i];
}
}
public void addedge(char srcv, char destv, int weight) {
int srcindex = getindexofv(srcv);
int destindex = getindexofv(destv);
addedgechild(srcindex, destindex, weight);
if (!isdirect) {
addedgechild(destindex, srcindex, weight);
}
}
private void addedgechild(int srcindex, int destindex, int weight) {
node cur = edglist.get(srcindex);
while (cur != null) {
//是否存在该值
if (cur.dest == destindex) {
return;
}
cur = cur.next;
}
//不存在,创建
node newnode = new node(srcindex, destindex, weight);
newnode.next = edglist.get(srcindex);
edglist.set(srcindex, newnode);
}
private int getindexofv(char v) {
for (int i = 0; i < arrayv.length; i++) {
if (arrayv[i] == v) {
return i;
}
}
return -1;
}
public void printgraph() {
for (int i = 0; i < arrayv.length; i++) {
system.out.print(arrayv[i]);
node cur = edglist.get(i);
while (cur != null) {
system.out.print("->" + arrayv[cur.dest]);
cur = cur.next;
}
system.out.println();
}
}
public int getdevofv(char v) {
int srcindex = getindexofv(v);
int count = 0;
node cur = edglist.get(srcindex);
while (cur != null) {
count++;
cur = cur.next;
}
//有向图额外考虑入度
if (isdirect) {
for (int i = 0; i < arrayv.length; i++) {
//入度不需要考虑从本身出发的点
if (i == srcindex) {
continue;
} else {
cur = edglist.get(i);
while (cur != null) {
if (cur.dest == srcindex) {
count++;
}
cur = cur.next;
}
}
}
}
return count;
}
public static void main(string[] args) {
graphbynode graph = new graphbynode(false, 4);
char[] array = {'a', 'b', 'c', 'd'};
graph.initarrayv(array);
graph.addedge('a', 'b', 1);
graph.addedge('a', 'd', 1);
graph.addedge('b', 'a', 1);
graph.addedge('b', 'c', 1);
graph.addedge('c', 'b', 1);
graph.addedge('c', 'd', 1);
graph.addedge('d', 'a', 1);
graph.addedge('d', 'c', 1);
system.out.println("getdevofv:: "+graph.getdevofv('a'));
graph.printgraph();
}
}
深度优先遍历&广度优先遍历
/**
* 广度优先遍历
*
* @param v
*/
public void bfs(char v) {
//得到起点的坐标
int src = getindexofv(v);
//标记是否出现过
boolean[] visited = new boolean[arrayv.length];
queue<integer> queue = new linkedlist<>();
queue.offer(src);
while (!queue.isempty()) {
int top = queue.poll();
system.out.print("->" + arrayv[top]);
//弹出置为true
visited[top] = true;
for (int i = 0; i < arrayv.length; i++) {
if (matrix[top][i] != integer.max_value && !visited[i]) {
queue.offer(i);
visited[i] = true;
}
}
}
}
/**
* 深度优先遍历
*
* @param v
*/
public void dfs(char v) {
//得到起始位置
int index = getindexofv(v);
boolean[] visited = new boolean[arrayv.length];
dfschild(index, visited);
}
private void dfschild(int index, boolean[] visited) {
system.out.print(arrayv[index] + "->");
visited[index] = true;
for (int i = 0; i < arrayv.length; i++) {
if (matrix[index][i] != integer.max_value && !visited[i]) {
dfschild(i, visited);
}
}
}
发表评论