前言
memorystream 中的 getbuffer() 和 toarray() 是两个用于获取流数据的方法,但它们的核心区别在于 数据范围、内存占用和安全性。
一、核心区别
| 特性 | getbuffer() | toarray() |
|---|---|---|
| 返回内容 | 返回 底层缓冲区的完整数组 (包含未使用的空间)。 | 返回 仅包含有效数据的数组 (排除未使用的空间)。 |
| 内存占用 | 可能包含大量未使用的空字节(0 填充), 占用更多内存。 | 仅包含实际写入的数据, 内存更高效。 |
| 性能 | 速度快(直接返回引用,无需复制)。 | 速度较慢(需复制数据到新数组)。 |
| 安全性 | 可能暴露未初始化的字节(0 填充), 可能导致数据污染或解析错误。 | 仅返回有效数据, 避免未初始化字节的干扰。 |
二、具体示例
1.getbuffer()的示例
public class program
{
public static void main(string[] args)
{
using (memorystream ms = new memorystream())
{
byte[] data = encoding.utf8.getbytes("test");
ms.write(data, 0, data.length);
byte[] buffer = ms.getbuffer(); // 返回长度为 256 的数组(默认初始容量为 256)
console.writeline(buffer.length); // 输出:256
console.writeline(ms.length); // 输出:4(实际数据长度)
console.writeline(bitconverter.tostring(buffer));
// 输出:74-65-73-74-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00
}
}
}
- 问题:
- 返回的数组包含大量未使用的
0填充字节(如示例中的256 - 4 = 252个0)。 - 如果直接使用
buffer,可能导致数据解析错误(例如,将0误认为有效数据)。
- 返回的数组包含大量未使用的
2.toarray()的示例
public class program
{
public static void main(string[] args)
{
using (memorystream ms = new memorystream())
{
byte[] data = encoding.utf8.getbytes("test");
ms.write(data, 0, data.length);
byte[] bytes = ms.toarray(); // 返回长度为 4 的数组
console.writeline(bytes.length); // 输出:4
console.writeline(ms.length); // 输出:4(实际数据长度)
console.writeline(bitconverter.tostring(bytes));//输出:74-65-73-74
}
}
}
- 优势:
- 仅返回实际写入的数据(
length指定的范围),无多余0填充。 - 更适合需要精确数据的场景(如序列化、加密、文件传输)。
- 仅返回实际写入的数据(
三、关键场景对比
| 场景 | 推荐方法 | 原因 |
|---|---|---|
| 需要高效访问底层缓冲区(如直接操作内存) | getbuffer() | 避免复制开销,但需确保仅使用有效数据范围。 |
| 需要精确数据(如网络传输、文件保存) | toarray() | 确保数据不含未使用的 0,避免解析错误(如 excel 文件损坏问题)。 |
| 流的容量远大于实际数据 | toarray() | 避免浪费内存(如示例中 256 字节 vs 4 字节)。 |
| 需要避免未初始化字节的干扰 | toarray() | 仅返回有效数据,安全性更高。 |
四、注意事项
1. 异常情况
getbuffer()的限制:- 如果
memorystream是通过memorystream(byte[] buffer, bool writable)构造函数创建,并且publiclyvisible参数未设置为true,则调用getbuffer()会抛出unauthorizedaccessexception。 - 解决方案:改用
toarray()或确保构造时允许公开访问缓冲区。
- 如果
2. 容量与长度
capacityvslength:capacity是底层缓冲区的总大小(如默认256)。length是实际写入数据的大小(如4)。getbuffer()返回的数组长度等于capacity,而toarray()返回的数组长度等于length。
3. 性能权衡
- 大数据场景:
- 如果需要频繁操作大容量数据,可先通过
getbuffer()直接操作内存,但需严格控制访问范围(如length内)。
- 如果需要频繁操作大容量数据,可先通过
- 小数据或精确性优先:
- 直接使用
toarray(),避免未初始化字节的干扰。
- 直接使用
五、使用建议
- 优先使用
toarray(),除非明确需要直接操作底层缓冲区且能确保安全。 - 在涉及文件导出、网络传输或第三方库解析时,
toarray()更可靠(如解决 excel 文件损坏问题)。 - 通过
trygetbuffer()替代getbuffer(),避免异常风险。- .net 4.5+ 引入了
trygetbuffer()方法,可安全检查是否允许获取缓冲区:
using (memorystream ms = new memorystream()) { if (ms.trygetbuffer(out var buffer)) { // 安全获取缓冲区 byte[] data = new byte[ms.length]; array.copy(buffer.array, buffer.offset, data, 0, (int)ms.length); } else { // 使用 toarray() byte[] data = ms.toarray(); } } - .net 4.5+ 引入了
到此这篇关于c# memorystream 中 toarray 和 getbuffer 的区别的文章就介绍到这了,更多相关c# toarray getbuffer内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论