buffer缓冲区操作与内存管理
1 buffer的设计原理和内存模型
1.1 buffer到底是什么
buffer就是java nio里的数据容器,专门用来存放各种基本类型的数据。你可以把它想象成一个智能的数组,不仅能存数据,还知道自己当前读到哪了、写到哪了。
和channel配合使用时,buffer就像是数据的中转站。channel负责传输,buffer负责存储,两者分工明确。
buffer有几个设计特点:
- 专一性:每种数据类型都有对应的buffer,比如bytebuffer、intbuffer
- 内存灵活:可以用堆内存,也可以用堆外内存
- 状态清晰:读模式和写模式分得很清楚
- 自动跟踪:会自动记录当前操作的位置
1.2 buffer家族成员
java nio的buffer家族结构很简单,就是一个抽象父类加上各种具体实现:
buffer (抽象类) ├── bytebuffer // 最常用的,处理字节数据 │ └── mappedbytebuffer // 内存映射文件专用 │ ├── directbytebuffer // 直接内存实现 │ └── filechannelimpl.mappedbytebufferadapter ├── charbuffer // 处理字符 ├── doublebuffer // 处理双精度浮点数 ├── floatbuffer // 处理单精度浮点数 ├── intbuffer // 处理整数 ├── longbuffer // 处理长整数 └── shortbuffer // 处理短整数
bytebuffer是老大,用得最多,因为网络传输和文件操作基本都是字节流。mappedbytebuffer是个特殊的存在,专门用来做内存映射文件,读写大文件时特别有用。
1.3 buffer的内存模型
buffer的内存可以从两个角度来看:
1.3.1 逻辑上怎么理解
逻辑上,buffer就是一个有序的数组,里面装着同一种类型的数据。每个位置都有索引,你可以直接跳到任意位置读写数据。
buffer用三个重要的指针来管理这个数组:position(当前位置)、limit(边界)和capacity(总容量)。这三个指针决定了你能在哪读、在哪写、总共有多大空间。
1.3.2 物理上怎么实现
物理实现上,buffer有两种存储方式:
堆缓冲区(heapbuffer):
- 数据存在jvm堆内存里
- 底层就是个普通的java数组
- 会被垃圾回收器管理
- 创建方式:
bytebuffer.allocate(1024)
直接缓冲区(directbuffer):
- 数据存在操作系统的原生内存里(堆外内存)
- 不占用jvm堆空间
- 垃圾回收器管不着,需要手动或等待回收
- 创建方式:
bytebuffer.allocatedirect(1024)
还有个特殊的mappedbytebuffer,它把文件直接映射到内存里,读写文件就像操作内存一样快。
2 position、limit、capacity三大属性详解
buffer有三个关键属性:position、limit和capacity。这三个属性就像是buffer的gps,告诉你现在在哪、能到哪、总共有多大。
2.1 capacity(容量)
capacity就是buffer的总容量,创建时就定死了,后面改不了。就像买了个1024字节的水桶,不管你装多少水,桶的容量就是1024。
- 含义:buffer最多能装多少个元素
- 特点:一旦创建就固定了
- 范围:capacity ≥ 0
// 创建一个能装1024个字节的buffer bytebuffer buffer = bytebuffer.allocate(1024); int capacity = buffer.capacity(); // 返回1024,永远不变
2.2 position(位置)
position是个移动的指针,指向下一个要操作的位置。每次读写数据,这个指针就会自动往前移。
- 含义:下一个要读或写的位置
- 特点:会随着操作自动移动
- 范围:0 ≤ position ≤ limit
写模式时,position指向下一个要写入的地方;读模式时,position指向下一个要读取的地方。
bytebuffer buffer = bytebuffer.allocate(10); buffer.put((byte) 'a'); // position从0跳到1 buffer.put((byte) 'b'); // position从1跳到2 int currentposition = buffer.position(); // 现在是2
2.3 limit(限制)
limit是个边界线,告诉你最多能操作到哪里。超过这条线就不能读写了。
- 含义:第一个不能碰的位置
- 特点:可以手动调整
- 范围:position ≤ limit ≤ capacity
写模式时,limit就是capacity(能写满整个buffer);读模式时,limit是之前写了多少数据。
bytebuffer buffer = bytebuffer.allocate(10); // 写模式:limit = capacity = 10,可以写满 int limitinwritemode = buffer.limit(); // 返回10 // 写入3个字节后切换到读模式 buffer.put((byte) 'a').put((byte) 'b').put((byte) 'c'); buffer.flip(); // 切换到读模式 // 读模式:limit = 3,只能读这3个字节 int limitinreadmode = buffer.limit(); // 返回3
2.4 三个属性的关系图解
用一个例子来看看这三个属性是怎么配合工作的:
// 创建一个能装8个字节的buffer bytebuffer buffer = bytebuffer.allocate(8); system.out.println("刚创建时:"); system.out.println("capacity: " + buffer.capacity()); // 8,总容量 system.out.println("limit: " + buffer.limit()); // 8,能写到哪 system.out.println("position: " + buffer.position()); // 0,当前位置 // 写入数据 buffer.put("abcd".getbytes()); system.out.println("\n写入abcd后:"); system.out.println("capacity: " + buffer.capacity()); // 8,总容量不变 system.out.println("limit: " + buffer.limit()); // 8,还能继续写 system.out.println("position: " + buffer.position()); // 4,指针移到第4位 // 切换到读模式 buffer.flip(); system.out.println("\nflip()切换读模式后:"); system.out.println("capacity: " + buffer.capacity()); // 8,总容量不变 system.out.println("limit: " + buffer.limit()); // 4,只能读4个字节 system.out.println("position: " + buffer.position()); // 0,从头开始读
状态变化图示:
刚创建(写模式): [0][1][2][3][4][5][6][7] ^ ^ position limit/capacity 写入abcd后: [a][b][c][d][ ][ ][ ][ ] ^ ^ position limit/capacity flip()后(读模式): [a][b][c][d][ ][ ][ ][ ] ^ ^ ^ position limit capacity
2.5 mark(标记)
mark就像是在buffer上做个书签,记住某个位置,以后可以快速跳回来。
- 含义:临时记住的位置
- 特点:可有可无,默认没有
- 范围:mark ≤ position
bytebuffer buffer = bytebuffer.allocate(10); buffer.put((byte) 'a'); buffer.put((byte) 'b'); buffer.mark(); // 在position=2的地方做个书签 buffer.put((byte) 'c'); buffer.reset(); // 跳回书签位置(position=2)
3 读写模式切换和常用操作方法
3.1 读写模式切换
buffer就像一个双向通道,可以往里写数据,也可以从里面读数据。但不能同时进行,需要在写模式和读模式之间切换。
3.1.1 flip():写模式切换到读模式
public final buffer flip() { limit = position; // 设置读取边界 position = 0; // 从头开始读 mark = -1; // 清除书签 return this; }
flip()就像翻书一样,做三件事:
- 把当前写到的位置设为读取边界(limit = position)
- 把读取指针拉回到开头(position = 0)
- 清除之前的书签(mark = -1)
这样就能从头开始读取刚才写入的数据了。
3.1.2 clear():读模式切换到写模式
public final buffer clear() { position = 0; // 从头开始写 limit = capacity; // 可以写满整个buffer mark = -1; // 清除书签 return this; }
clear()就像清空黑板重新写字,做三件事:
- 把写入指针拉回到开头(position = 0)
- 允许写满整个buffer(limit = capacity)
- 清除之前的书签(mark = -1)
注意:clear()并不会真的清除数据,只是重置了指针,旧数据会被新数据覆盖。
3.1.3 compact():部分读模式切换到写模式
public bytebuffer compact() { // 把没读完的数据移到前面 system.arraycopy(hb, ix(position()), hb, ix(0), remaining()); position(remaining()); // position指向未读数据后面 limit(capacity()); // 可以写满整个buffer discardmark(); // 清除书签 return this; }
compact()比较聪明,它会保留没读完的数据:
- 把没读完的数据移到buffer开头
- position指向这些数据的后面(可以继续写新数据)
- limit设为capacity(允许写满)
- 清除书签
这样既保留了未读数据,又能继续写入新数据。
3.2 常用操作方法
3.2.1 分配buffer
// 在jvm堆内存里创建,速度快 bytebuffer heapbuffer = bytebuffer.allocate(1024); // 在系统内存里创建,i/o效率高 bytebuffer directbuffer = bytebuffer.allocatedirect(1024); // 把现有数组包装成buffer byte[] array = new byte[1024]; bytebuffer wrappedbuffer = bytebuffer.wrap(array);
3.2.2 写入数据
// 写一个字节,position自动+1 buffer.put((byte) 127); // 写一串字节 byte[] data = "hello".getbytes(); buffer.put(data); // 在指定位置写入,不影响position buffer.put(3, (byte) 65); // 在第3个位置写入'a' // 从数组的某个位置开始,写入指定长度 buffer.put(data, 1, 3); // 从data[1]开始写3个字节
3.2.3 读取数据
// 读一个字节,position自动+1 byte b = buffer.get(); // 读一串字节到数组里 byte[] data = new byte[10]; buffer.get(data); // 从指定位置读取,不影响position byte b = buffer.get(3); // 读取第3个位置的字节 // 读指定长度到数组的某个位置 buffer.get(data, 1, 3); // 读3个字节到data[1]开始的位置
3.2.4 其他常用操作
// 做书签和跳回书签 buffer.mark(); // 在当前position做个书签 buffer.reset(); // 跳回书签位置 // 倒带,position回到0 buffer.rewind(); // 检查还能读多少 boolean hasremaining = buffer.hasremaining(); // 还有数据吗? int remaining = buffer.remaining(); // 还剩多少个(limit - position) // 手动移动position buffer.position(buffer.position() + 3); // 跳过3个位置 // 复制buffer,共享数据但各自有独立的指针 bytebuffer duplicate = buffer.duplicate(); // 创建只读版本,不能修改数据 bytebuffer readonlybuffer = buffer.asreadonlybuffer(); // 切片,共享一部分数据 bytebuffer slicedbuffer = buffer.slice(2, 5); // 从位置2开始,长度5的片段
3.3 buffer操作的最佳实践
- 检查返回值:读写操作可能没有处理完所有数据
- 记得flip():写完数据要调用flip()才能读取
- 重复利用:用clear()或compact()重用buffer,别老是new
- 选对类型:什么数据用什么buffer(bytebuffer、intbuffer等)
- 直接缓冲区要小心:它不归垃圾回收器管,用完要手动释放
4 直接缓冲区vs非直接缓冲区的性能差异
4.1 两种缓冲区的实现机制
4.1.1 非直接缓冲区(heapbuffer)
非直接缓冲区就是在jvm堆内存里创建的buffer,底层用的是普通java数组。做i/o操作时,jvm需要把数据在堆内存和系统内存之间复制一遍。
bytebuffer heapbuffer = bytebuffer.allocate(1024); // 在堆内存里创建
内部实现:
// heapbytebuffer的底层实现(简化版) final byte[] hb; // 就是个普通数组 final int offset; // 数组里的起始位置 // 读取操作 public byte get() { return hb[ix(nextgetindex())]; } // 写入操作 public bytebuffer put(byte b) { hb[ix(nextputindex())] = b; return this; }
4.1.2 直接缓冲区(directbuffer)
直接缓冲区是在系统内存里创建的buffer,不在jvm堆里。它通过jni调用系统api分配内存,java通过unsafe类来访问这块内存。
bytebuffer directbuffer = bytebuffer.allocatedirect(1024); // 在系统内存里创建
内部实现:
// directbytebuffer的底层实现(简化版) private long address; // 系统内存地址 // 读取操作 public byte get() { return unsafe.getbyte(ix(nextgetindex())); // 直接从系统内存读 } // 写入操作 public bytebuffer put(byte b) { unsafe.putbyte(ix(nextputindex()), b); // 直接写到系统内存 return this; }
4.2 性能差异分析
4.2.1 内存分配性能
缓冲区类型 | 分配速度 | 释放速度 | 内存压力 |
---|---|---|---|
非直接缓冲区 | 快 | gc自动回收 | 占用堆内存 |
直接缓冲区 | 慢(要调系统api) | 看gc脸色或手动释放 | 不占堆内存 |
直接缓冲区创建比较慢,因为要调用系统api分配内存。但一旦创建好了,做i/o操作时通常比非直接缓冲区快。
4.2.2 i/o操作性能
缓冲区类型 | 读写性能 | 数据复制 | 适用场景 |
---|---|---|---|
非直接缓冲区 | 一般 | 要在堆内存和系统内存间复制 | 小数据、偶尔用用 |
直接缓冲区 | 快 | 不用复制 | 大数据、频繁i/o |
直接缓冲区做i/o时比较快,因为不用在堆内存和系统内存之间复制数据。用channel传输数据时,直接缓冲区可以直接参与,而非直接缓冲区还得先复制到一个临时的直接缓冲区里。
4.2.3 内存访问性能
缓冲区类型 | 读写速度 | cpu缓存友好性 | jvm优化 |
---|---|---|---|
非直接缓冲区 | 一般更快 | 好 | jit能优化 |
直接缓冲区 | 通过jni访问,可能慢点 | 一般 | 优化有限 |
如果只是在java代码里频繁读写buffer,非直接缓冲区通常更快,因为它在jvm堆里,jit编译器能优化,对cpu缓存也更友好。
4.3 性能测试案例
来个实际测试,看看两种buffer在不同场景下的表现:
public class bufferperformancetest { private static final int buffer_size = 1024 * 1024; // 1mb大小 private static final int iterations = 1000; // 测试1000次 public static void main(string[] args) throws exception { // 测试创建速度 testallocation(); // 测试i/o速度 testio(); // 测试读写速度 testmemoryaccess(); } private static void testallocation() { long start, end; // 测试堆内存buffer创建速度 start = system.nanotime(); for (int i = 0; i < iterations; i++) { bytebuffer buffer = bytebuffer.allocate(buffer_size); // 在堆里创建 buffer.put((byte) 1); // 写点数据 } end = system.nanotime(); system.out.println("堆buffer创建: " + (end - start) / 1000000 + "ms"); // 测试直接buffer创建速度 start = system.nanotime(); for (int i = 0; i < iterations; i++) { bytebuffer buffer = bytebuffer.allocatedirect(buffer_size); // 在系统内存创建 buffer.put((byte) 1); // 写点数据 } end = system.nanotime(); system.out.println("直接buffer创建: " + (end - start) / 1000000 + "ms"); } private static void testio() throws exception { file tempfile = file.createtempfile("buffer-test", ".tmp"); // 创建临时文件 tempfile.deleteonexit(); // 程序结束时删除 // 准备测试数据 bytebuffer data = bytebuffer.allocate(buffer_size); while (data.hasremaining()) { data.put((byte) 'a'); // 填充数据 } data.flip(); // 切换到读模式 // 测试堆buffer的i/o速度 bytebuffer heapbuffer = bytebuffer.allocate(buffer_size); testfileio(heapbuffer, tempfile, "堆buffer i/o"); // 测试直接buffer的i/o速度 bytebuffer directbuffer = bytebuffer.allocatedirect(buffer_size); testfileio(directbuffer, tempfile, "直接buffer i/o"); } private static void testfileio(bytebuffer buffer, file file, string label) throws exception { filechannel channel = new fileoutputstream(file).getchannel(); // 获取文件通道 long start = system.nanotime(); // 开始计时 for (int i = 0; i < iterations; i++) { buffer.clear(); // 清空buffer,准备写入 buffer.put(new byte[buffer_size]); // 写入数据 buffer.flip(); // 切换到读模式 while (buffer.hasremaining()) { channel.write(buffer); // 写到文件 } } channel.close(); // 关闭通道 long end = system.nanotime(); // 结束计时 system.out.println(label + ": " + (end - start) / 1000000 + "ms"); } private static void testmemoryaccess() { bytebuffer heapbuffer = bytebuffer.allocate(buffer_size); // 堆buffer bytebuffer directbuffer = bytebuffer.allocatedirect(buffer_size); // 直接buffer // 测试堆buffer读写速度 long start = system.nanotime(); for (int i = 0; i < iterations; i++) { for (int j = 0; j < 1024; j++) { heapbuffer.put(j, (byte) j); // 在指定位置写入 } for (int j = 0; j < 1024; j++) { byte b = heapbuffer.get(j); // 从指定位置读取 } } long end = system.nanotime(); system.out.println("堆buffer读写: " + (end - start) / 1000000 + "ms"); // 测试直接buffer读写速度 start = system.nanotime(); for (int i = 0; i < iterations; i++) { for (int j = 0; j < 1024; j++) { directbuffer.put(j, (byte) j); // 在指定位置写入 } for (int j = 0; j < 1024; j++) { byte b = directbuffer.get(j); // 从指定位置读取 } } end = system.nanotime(); system.out.println("直接buffer读写: " + (end - start) / 1000000 + "ms"); } }
4.4 选择合适的缓冲区类型
根据性能特点,可以按照以下原则选择buffer类型:
场景 | 推荐buffer类型 | 原因 |
---|---|---|
大文件i/o | 直接buffer | 不用复制内存,i/o快 |
网络通信 | 直接buffer | 减少数据复制,吞吐量高 |
临时小数据处理 | 堆buffer | 创建快,gc友好 |
频繁创建销毁 | 堆buffer | 避免直接buffer创建的开销 |
长期重用的buffer | 直接buffer | 一次创建多次使用,摊销成本 |
在物联网平台的实际应用中,通常会根据不同场景选择不同buffer类型:
- 设备数据采集:用直接buffer处理大量传感器数据
- 配置信息传输:用堆buffer处理小型配置数据
- 文件存储:用直接buffer或mappedbytebuffer处理大型日志文件
- 实时数据处理:用直接buffer提高网络通信效率
5 总结
buffer是java nio的核心组件,就像一个智能的数据容器,让我们能高效地处理各种数据。通过掌握buffer的工作原理、核心属性和操作方法,以及两种buffer类型的性能特点,我们就能在物联网平台等高性能应用中做出更好的技术选择。
buffer的核心价值:
- 和channel完美配合:让i/o操作变得高效
- 灵活的内存管理:既能用堆内存,也能用系统内存
- 精确的状态控制:通过position、limit、capacity准确控制数据读写
- 类型安全:针对不同数据类型提供专门的buffer
掌握了buffer,我们就为学习java nio打下了坚实基础。下一篇文章,我们将深入探讨selector选择器,看看它如何实现多路复用i/o,让一个线程同时处理多个连接。
到此这篇关于java buffer缓冲区操作与内存管理的文章就介绍到这了,更多相关java buffer缓冲区内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论