C# MemoryStream中ToArray和GetBuffer的区别小小结_Asp.net

前言

memorystream 中的 getbuffer() 和 toarray() 是两个用于获取流数据的方法，但它们的核心区别在于 数据范围、内存占用和安全性。

一、核心区别

特性	getbuffer()	toarray()
返回内容	返回底层缓冲区的完整数组（包含未使用的空间）。	返回仅包含有效数据的数组（排除未使用的空间）。
内存占用	可能包含大量未使用的空字节（0 填充），占用更多内存。	仅包含实际写入的数据，内存更高效。
性能	速度快（直接返回引用，无需复制）。	速度较慢（需复制数据到新数组）。
安全性	可能暴露未初始化的字节（0 填充），可能导致数据污染或解析错误。	仅返回有效数据，避免未初始化字节的干扰。

二、具体示例

1.getbuffer()的示例

public class program
{
    public static void main(string[] args)
    {
        using (memorystream ms = new memorystream())
        {
            byte[] data = encoding.utf8.getbytes("test");
            ms.write(data, 0, data.length);

            byte[] buffer = ms.getbuffer(); // 返回长度为 256 的数组（默认初始容量为 256）
            console.writeline(buffer.length); // 输出：256
            console.writeline(ms.length);     // 输出：4（实际数据长度）
            console.writeline(bitconverter.tostring(buffer));
            // 输出：74-65-73-74-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00
        }
    }
}

问题：
- 返回的数组包含大量未使用的 0 填充字节（如示例中的 256 - 4 = 252 个 0）。
- 如果直接使用 buffer，可能导致数据解析错误（例如，将 0 误认为有效数据）。

2.toarray()的示例

public class program
{
    public static void main(string[] args)
    {
        using (memorystream ms = new memorystream())
        {
            byte[] data = encoding.utf8.getbytes("test");
            ms.write(data, 0, data.length);

            byte[] bytes = ms.toarray(); // 返回长度为 4 的数组
            console.writeline(bytes.length); // 输出：4
            console.writeline(ms.length);     // 输出：4（实际数据长度）
            console.writeline(bitconverter.tostring(bytes));//输出：74-65-73-74
        }
    }
}

优势：
- 仅返回实际写入的数据（length 指定的范围），无多余 0 填充。
- 更适合需要精确数据的场景（如序列化、加密、文件传输）。

三、关键场景对比

场景	推荐方法	原因
需要高效访问底层缓冲区（如直接操作内存）	getbuffer()	避免复制开销，但需确保仅使用有效数据范围。
需要精确数据（如网络传输、文件保存）	toarray()	确保数据不含未使用的 0，避免解析错误（如 excel 文件损坏问题）。
流的容量远大于实际数据	toarray()	避免浪费内存（如示例中 256 字节 vs 4 字节）。
需要避免未初始化字节的干扰	toarray()	仅返回有效数据，安全性更高。

四、注意事项

1. 异常情况

getbuffer() 的限制：
- 如果 memorystream 是通过 memorystream(byte[] buffer, bool writable) 构造函数创建，并且 publiclyvisible 参数未设置为 true，则调用 getbuffer() 会抛出 unauthorizedaccessexception。
- 解决方案：改用 toarray() 或确保构造时允许公开访问缓冲区。

2. 容量与长度

capacity vs length：
- capacity 是底层缓冲区的总大小（如默认 256）。
- length 是实际写入数据的大小（如 4）。
- getbuffer() 返回的数组长度等于 capacity，而 toarray() 返回的数组长度等于 length。

3. 性能权衡

大数据场景：
- 如果需要频繁操作大容量数据，可先通过 getbuffer() 直接操作内存，但需严格控制访问范围（如 length 内）。
小数据或精确性优先：
- 直接使用 toarray()，避免未初始化字节的干扰。

五、使用建议

优先使用 toarray()，除非明确需要直接操作底层缓冲区且能确保安全。
在涉及文件导出、网络传输或第三方库解析时，toarray() 更可靠（如解决 excel 文件损坏问题）。

通过 trygetbuffer() 替代 getbuffer()，避免异常风险。

.net 4.5+ 引入了 trygetbuffer() 方法，可安全检查是否允许获取缓冲区：

using (memorystream ms = new memorystream())
{
    if (ms.trygetbuffer(out var buffer))
    {
        // 安全获取缓冲区
        byte[] data = new byte[ms.length];
        array.copy(buffer.array, buffer.offset, data, 0, (int)ms.length);
    }
    else
    {
        // 使用 toarray()
        byte[] data = ms.toarray();
    }
}

到此这篇关于c# memorystream 中 toarray 和 getbuffer 的区别的文章就介绍到这了,更多相关c# toarray getbuffer内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！