一、源码及框架分析
在 sgi-stl 30 版本中,map 和 set 的实现巧妙地复用了同一棵红黑树(rb_tree)。其核心代码主要位于 stl_tree.h、stl_map.h 和 stl_set.h 中。
1.1 框架核心代码
以下是 set 和 map 的简化定义:
// stl_set.h
template <class key, class compare = less<key>, class alloc = alloc>
class set {
public:
typedef key key_type;
typedef key value_type;
private:
typedef rb_tree<key_type, value_type,
identity<value_type>, key_compare, alloc> rep_type;
rep_type t; // 底层红黑树
};
// stl_map.h
template <class key, class t, class compare = less<key>, class alloc = alloc>
class map {
public:
typedef key key_type;
typedef t mapped_type;
typedef pair<const key, t> value_type;
private:
typedef rb_tree<key_type, value_type,
select1st<value_type>, key_compare, alloc> rep_type;
rep_type t; // 底层红黑树
};1.2 红黑树的泛型设计
rb_tree 通过模板参数实现泛型,使其既能用于 set(存储 key),也能用于 map(存储 pair<const key, t>)。其结点定义如下:
template <class value>
struct __rb_tree_node : public __rb_tree_node_base {
typedef __rb_tree_node<value>* link_type;
value value_field; // 存储的实际数据
};rb_tree 的模板参数:
template <class key, class value, class keyofvalue, class compare, class alloc = alloc>
class rb_tree {
// ...
};key:键的类型,用于find、erase等接口的参数类型。value:结点中存储的数据类型,在set中为key,在map中为pair<const key, t>。keyofvalue:仿函数,用于从value中提取key,因为红黑树在比较时只比较键。
1.3 为何需要两个模板参数key和value?
set 的两个模板参数相同,map 则不同。这是因为:
value决定了结点存储的内容。key决定了find、erase等函数接受的参数类型。
map 中 value 是 pair<const key, t>,但查找时只需传入 key 类型的值,因此两个模板参数缺一不可。
注:源码中命名风格略有混乱,
set使用key,map使用key和t,rb_tree又使用key和value,但设计思路清晰。
二、模拟实现 map 和 set
接下来,我们将基于自己实现的红黑树,封装出 map 和 set。
2.1 实现红黑树框架,支持插入
我们首先实现一个红黑树 rbtree,它通过 keyoft 仿函数提取键值进行比较。
rbtree.h
enum colour { red, black };
template<class t>
struct rbtreenode {
t _data;
rbtreenode<t>* _left;
rbtreenode<t>* _right;
rbtreenode<t>* _parent;
colour _col;
rbtreenode(const t& data)
: _data(data), _left(nullptr), _right(nullptr), _parent(nullptr), _col(red) {}
};
template<class k, class t, class keyoft>
class rbtree {
typedef rbtreenode<t> node;
public:
bool insert(const t& data) {
if (_root == nullptr) {
_root = new node(data);
_root->_col = black;
return true;
}
keyoft kot;
node* parent = nullptr;
node* cur = _root;
while (cur) {
if (kot(cur->_data) < kot(data)) {
parent = cur;
cur = cur->_right;
} else if (kot(cur->_data) > kot(data)) {
parent = cur;
cur = cur->_left;
} else {
return false; // 键已存在
}
}
cur = new node(data);
node* newnode = cur;
cur->_col = red;
if (kot(parent->_data) < kot(data))
parent->_right = cur;
else
parent->_left = cur;
cur->_parent = parent;
// 后续平衡处理(旋转、变色)省略,完整代码见文末
return true;
}
private:
node* _root = nullptr;
};mymap.h
namespace bit {
template<class k, class v>
class map {
struct mapkeyoft {
const k& operator()(const pair<k, v>& kv) {
return kv.first;
}
};
public:
bool insert(const pair<k, v>& kv) {
return _t.insert(kv);
}
private:
rbtree<k, pair<k, v>, mapkeyoft> _t;
};
}myset.h
namespace bit {
template<class k>
class set {
struct setkeyoft {
const k& operator()(const k& key) {
return key;
}
};
public:
bool insert(const k& key) {
return _t.insert(key);
}
private:
rbtree<k, k, setkeyoft> _t;
};
}2.2 支持迭代器
迭代器的核心是 operator++ 和 operator--,实现中序遍历的步进逻辑。
迭代器实现思路
begin():返回中序第一个结点(最左结点)。end():返回nullptr(或源码中的哨兵头结点)。operator++():- 若右子树非空,找右子树的最左结点。
- 若右子树为空,向上找第一个“当前结点是左孩子”的祖先结点。
operator--():逻辑与++对称,反向遍历。
迭代器代码
template<class t, class ref, class ptr>
struct rbtreeiterator {
typedef rbtreenode<t> node;
typedef rbtreeiterator<t, ref, ptr> self;
node* _node;
node* _root; // 用于处理 end() 的情况
rbtreeiterator(node* node, node* root) : _node(node), _root(root) {}
ref operator*() { return _node->_data; }
ptr operator->() { return &_node->_data; }
self& operator++() {
if (_node->_right) {
node* leftmost = _node->_right;
while (leftmost->_left) leftmost = leftmost->_left;
_node = leftmost;
} else {
node* cur = _node;
node* parent = cur->_parent;
while (parent && cur == parent->_right) {
cur = parent;
parent = cur->_parent;
}
_node = parent;
}
return *this;
}
self& operator--() {
if (_node == nullptr) { // 处理 --end()
node* rightmost = _root;
while (rightmost && rightmost->_right) rightmost = rightmost->_right;
_node = rightmost;
} else if (_node->_left) {
node* rightmost = _node->_left;
while (rightmost->_right) rightmost = rightmost->_right;
_node = rightmost;
} else {
node* cur = _node;
node* parent = cur->_parent;
while (parent && cur == parent->_left) {
cur = parent;
parent = cur->_parent;
}
_node = parent;
}
return *this;
}
bool operator!=(const self& s) const { return _node != s._node; }
bool operator==(const self& s) const { return _node == s._node; }
};在 rbtree 中集成迭代器
template<class k, class t, class keyoft>
class rbtree {
public:
typedef rbtreeiterator<t, t&, t*> iterator;
typedef rbtreeiterator<t, const t&, const t*> constiterator;
iterator begin() {
node* leftmost = _root;
while (leftmost && leftmost->_left) leftmost = leftmost->_left;
return iterator(leftmost, _root);
}
iterator end() { return iterator(nullptr, _root); }
// 同理实现 constiterator
private:
node* _root = nullptr;
};2.3 支持operator[]
map 的 [] 需要借助 insert 的返回值实现。因此,rbtree::insert 需返回 pair<iterator, bool>。
pair<iterator, bool> insert(const t& data) {
// 插入逻辑,返回插入位置的迭代器及是否成功
}然后在 map 中:
v& operator[](const k& key) {
pair<iterator, bool> ret = insert(make_pair(key, v()));
return ret.first->second;
}2.4 完整代码
最终版myset.h
#include "rbtree.h"
namespace bit {
template<class k>
class set {
struct setkeyoft {
const k& operator()(const k& key) { return key; }
};
public:
typedef typename rbtree<k, const k, setkeyoft>::iterator iterator;
typedef typename rbtree<k, const k, setkeyoft>::constiterator const_iterator;
iterator begin() { return _t.begin(); }
iterator end() { return _t.end(); }
const_iterator begin() const { return _t.begin(); }
const_iterator end() const { return _t.end(); }
pair<iterator, bool> insert(const k& key) { return _t.insert(key); }
iterator find(const k& key) { return _t.find(key); }
private:
rbtree<k, const k, setkeyoft> _t;
};
}最终版mymap.h
#include "rbtree.h"
namespace bit {
template<class k, class v>
class map {
struct mapkeyoft {
const k& operator()(const pair<k, v>& kv) { return kv.first; }
};
public:
typedef typename rbtree<k, pair<const k, v>, mapkeyoft>::iterator iterator;
typedef typename rbtree<k, pair<const k, v>, mapkeyoft>::constiterator const_iterator;
iterator begin() { return _t.begin(); }
iterator end() { return _t.end(); }
const_iterator begin() const { return _t.begin(); }
const_iterator end() const { return _t.end(); }
pair<iterator, bool> insert(const pair<k, v>& kv) { return _t.insert(kv); }
iterator find(const k& key) { return _t.find(key); }
v& operator[](const k& key) {
pair<iterator, bool> ret = insert(make_pair(key, v()));
return ret.first->second;
}
private:
rbtree<k, pair<const k, v>, mapkeyoft> _t;
};
}最终版rbtree.h
完整代码请参考文末总结部分,或结合上述片段整合。核心包括:
- 结点定义
- 插入与平衡(旋转、变色)
- 迭代器实现
find、begin、end等接口
三、总结
通过封装红黑树实现 map 和 set,我们深入理解了 stl 中容器复用的设计思想:
- 泛型设计:红黑树通过
value模板参数决定存储内容,通过keyoft仿函数提取键值进行比较。 - 迭代器实现:中序遍历的步进逻辑是迭代器实现的核心,需同时处理左右子树与祖先关系。
map的[]实现:依赖于insert的返回值,简洁高效。- 权限控制:
set的迭代器不允许修改键值,通过将value模板参数设为const k实现;map则通过pair<const k, v>保护键不被修改。
这种复用方式不仅减少了代码量,还体现了面向对象与泛型编程的强大结合。
到此这篇关于c++封装红黑树实现mymap和myset完整代码的文章就介绍到这了,更多相关封装红黑树mymap和myset内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论