Java实现ByteArray与String互转的常见转换方法_Java

在现代 java 开发中，处理字节数据（byte[]）和字符串（string）之间的转换是一项常见且至关重要的任务。无论是网络通信、文件操作、加密解密还是序列化反序列化，我们都需要在 byte[] 和 string 之间进行高效、准确的转换。然而，这个看似简单的操作背后，隐藏着一个容易被忽视但又极其关键的问题——编码（encoding）。

什么是编码？

编码（encoding）是指将一种数据形式（如字符）转换为另一种数据形式（如字节序列）的过程。在计算机世界里，字符（如 ‘a’、‘中’、‘🙂’）本质上是抽象的概念，而计算机只能处理二进制数据。因此，我们需要一套规则（编码标准）来规定字符如何映射到字节序列上。

常见的字符编码标准包括：

ascii：仅支持 128 个字符（0-127），主要用于英文。
iso-8859-1：也称 latin-1，支持 256 个字符，覆盖了西欧语言。
utf-8：可变长度编码，支持世界上几乎所有语言的字符，是互联网上最广泛使用的编码。
utf-16：固定长度或可变长度（16位），常用于 java 内部表示字符串。
gbk/gb2312：中文字符编码，主要在中国大陆使用。

为什么编码问题如此重要？

想象一下，你从一个文件中读取了一段文本数据，这段数据是以 utf-8 编码保存的。如果你在处理这段数据时，错误地使用了 iso-8859-1 编码去解析它，那么你得到的可能就不是原始的中文文本，而是一串乱码。这就是编码问题带来的后果。

在 java 中，string 类内部使用的是 utf-16 编码。当我们需要将 string 转换为 byte[] 或者反过来时，如果不指定正确的编码方式，就很容易导致转换失败或产生乱码。

常见的转换方法与陷阱

1. 直接使用getbytes()和new string(byte[])

这是最容易想到的方法，但它存在很大的风险。

// 错误示例：没有指定编码
string str = "hello 世界 🌍"; // 包含中文和 emoji
byte[] bytes = str.getbytes(); // 默认使用平台默认编码（通常是 iso-8859-1 或类似）
string backtostr = new string(bytes); // 默认使用平台默认编码解码

system.out.println("原字符串: " + str);
system.out.println("转换后字符串: " + backtostr); // 可能出现乱码！

这段代码的问题在于：

str.getbytes() 没有指定编码，默认使用 jvm 的默认编码（getdefaultcharset()）。在不同操作系统或 jvm 设置下，这个默认编码可能不同。
new string(bytes) 也没有指定编码，同样使用默认编码进行解码。如果编码不一致，就会产生乱码。

2. 明确指定编码

解决这个问题的关键是始终明确指定编码。

import java.nio.charset.standardcharsets;
import java.nio.charset.charset;
import java.util.arrays;

public class bytetostringexample {
    public static void main(string[] args) {
        string originalstr = "hello 世界 🌍";

        try {
            // ✅ 正确做法：明确指定编码
            byte[] bytes = originalstr.getbytes(standardcharsets.utf_8); // 使用 utf-8 编码
            string decodedstr = new string(bytes, standardcharsets.utf_8); // 使用 utf-8 解码

            system.out.println("原始字符串: " + originalstr);
            system.out.println("字节数组: " + arrays.tostring(bytes));
            system.out.println("转换回字符串: " + decodedstr);
            system.out.println("是否相等: " + originalstr.equals(decodedstr));

            // 🔍 也可以使用 charset 对象
            charset utf8charset = standardcharsets.utf_8;
            byte[] bytes2 = originalstr.getbytes(utf8charset);
            string decodedstr2 = new string(bytes2, utf8charset);
            system.out.println("使用 charset 对象: " + decodedstr2);

        } catch (exception e) {
            system.err.println("转换过程中发生错误: " + e.getmessage());
            e.printstacktrace();
        }
    }
}

输出示例:

原始字符串: hello 世界 🌍
字节数组: [72, 101, 108, 108, 111, 32, -28, -67, -96, -27, -101, -120, 32, -25, -121, -101, -27, -101, -120]
转换回字符串: hello 世界 🌍
是否相等: true
使用 charset 对象: hello 世界 🌍

3. 常用的编码常量

java 提供了 java.nio.charset.standardcharsets 类，其中包含了常用的编码常量，推荐优先使用这些常量，因为它们是 static final 的，性能更好，也避免了字符串硬编码的风险。

import java.nio.charset.standardcharsets;

// 推荐使用这些常量
byte[] utf8bytes = "hello".getbytes(standardcharsets.utf_8);
byte[] asciibytes = "hello".getbytes(standardcharsets.us_ascii);
byte[] latin1bytes = "hello".getbytes(standardcharsets.iso_8859_1);
byte[] utf16bytes = "hello".getbytes(standardcharsets.utf_16);
byte[] utf16bebytes = "hello".getbytes(standardcharsets.utf_16be);
byte[] utf16lebytes = "hello".getbytes(standardcharsets.utf_16le);

4. 处理不支持的编码

如果指定了一个 jvm 不支持的编码，会抛出 unsupportedencodingexception（java 8 及以前）或 illegalcharsetnameexception（java 9+）。

import java.nio.charset.unsupportedcharsetexception;
import java.nio.charset.illegalcharsetnameexception;

public class encodingerrorhandling {
    public static void main(string[] args) {
        string str = "hello";

        try {
            // ❌ 这种编码可能不存在
            byte[] bytes = str.getbytes("non_existent_encoding");
        } catch (unsupportedencodingexception | illegalcharsetnameexception e) {
            system.err.println("编码不支持: " + e.getmessage());
        }

        // ✅ 更安全的做法：先检查编码是否存在
        try {
            java.nio.charset.charset charset = java.nio.charset.charset.forname("utf-8");
            byte[] bytes = str.getbytes(charset);
            system.out.println("成功使用 utf-8 编码: " + arrays.tostring(bytes));
        } catch (exception e) {
            system.err.println("编码错误: " + e.getmessage());
        }
    }
}

实际应用场景

1. 文件读写

当你需要将字符串写入文件或从文件读取字符串时，编码尤为重要。

import java.io.*;
import java.nio.charset.standardcharsets;

public class fileencodingexample {
    public static void main(string[] args) {
        string filepath = "test.txt";
        string content = "hello 世界 🌍\nthis is a test file.";

        // ✅ 写入文件（指定编码）
        try (outputstreamwriter writer = new outputstreamwriter(
                new fileoutputstream(filepath), standardcharsets.utf_8)) {
            writer.write(content);
            system.out.println("文件写入成功。");
        } catch (ioexception e) {
            system.err.println("写入文件失败: " + e.getmessage());
        }

        // ✅ 读取文件（指定编码）
        try (inputstreamreader reader = new inputstreamreader(
                new fileinputstream(filepath), standardcharsets.utf_8)) {
            stringbuilder sb = new stringbuilder();
            int ch;
            while ((ch = reader.read()) != -1) {
                sb.append((char) ch);
            }
            string readcontent = sb.tostring();
            system.out.println("读取的文件内容:\n" + readcontent);
        } catch (ioexception e) {
            system.err.println("读取文件失败: " + e.getmessage());
        }
    }
}

2. 网络通信

在网络传输中，数据通常以字节流的形式发送。服务器和客户端必须使用相同的编码来解析数据。

import java.net.*;
import java.io.*;
import java.nio.charset.standardcharsets;

public class networkencodingexample {
    public static void main(string[] args) {
        // 模拟发送方：将字符串转换为字节发送
        string message = "hello server! 你好世界 🌍";
        byte[] messagebytes = message.getbytes(standardcharsets.utf_8);

        // 模拟接收方：接收字节并转换回字符串
        try {
            string receivedmessage = new string(messagebytes, standardcharsets.utf_8);
            system.out.println("接收到的消息: " + receivedmessage);
        } catch (exception e) {
            system.err.println("解码失败: " + e.getmessage());
        }
    }
}

3. 加密解密

在加密算法中，明文通常需要转换为字节进行加密，加密后的密文也是字节，最后可能需要将解密后的字节转换回字符串。

import javax.crypto.cipher;
import javax.crypto.keygenerator;
import javax.crypto.secretkey;
import java.nio.charset.standardcharsets;
import java.util.base64;

public class encryptiondecryptionexample {
    public static void main(string[] args) throws exception {
        string originaltext = "secret message 世界 🌍";
        keygenerator keygen = keygenerator.getinstance("aes");
        keygen.init(128); // 128 位密钥
        secretkey secretkey = keygen.generatekey();

        // 加密
        cipher cipher = cipher.getinstance("aes");
        cipher.init(cipher.encrypt_mode, secretkey);
        byte[] encryptedbytes = cipher.dofinal(originaltext.getbytes(standardcharsets.utf_8));
        string encodedencrypted = base64.getencoder().encodetostring(encryptedbytes);
        system.out.println("加密后的 base64: " + encodedencrypted);

        // 解密
        cipher.init(cipher.decrypt_mode, secretkey);
        byte[] decryptedbytes = cipher.dofinal(base64.getdecoder().decode(encodedencrypted));
        string decryptedtext = new string(decryptedbytes, standardcharsets.utf_8);
        system.out.println("解密后的文本: " + decryptedtext);
    }
}

4. http 请求响应

在处理 http 请求和响应时，请求体和响应体的编码也需要特别注意。

import java.net.http.*;
import java.net.uri;
import java.nio.charset.standardcharsets;
import java.time.duration;

public class httpencodingexample {
    public static void main(string[] args) {
        // 注意：这需要 java 11+ 的 httpclient api
        httpclient client = httpclient.newbuilder()
                .connecttimeout(duration.ofseconds(10))
                .build();

        // 发送 post 请求
        httprequest request = httprequest.newbuilder()
                .uri(uri.create("https://httpbin.org/post"))
                .header("content-type", "application/json; charset=utf-8")
                .post(httprequest.bodypublishers.ofstring("{\"message\": \"hello 世界 🌍\"}", standardcharsets.utf_8))
                .timeout(duration.ofseconds(20))
                .build();

        try {
            httpresponse<string> response = client.send(request, httpresponse.bodyhandlers.ofstring(standardcharsets.utf_8));
            system.out.println("响应状态码: " + response.statuscode());
            system.out.println("响应正文: " + response.body());
        } catch (exception e) {
            system.err.println("http 请求失败: " + e.getmessage());
        }
    }
}

高级技巧与最佳实践

1. 使用java.util.base64进行编码转换

有时候，我们需要将 byte[] 转换为可读的字符串（如 base64），然后再转换回来。

import java.util.base64;
import java.nio.charset.standardcharsets;

public class base64example {
    public static void main(string[] args) {
        string original = "hello 世界 🌍";

        // ✅ 将字符串编码为 base64 字符串
        byte[] bytes = original.getbytes(standardcharsets.utf_8);
        string base64encoded = base64.getencoder().encodetostring(bytes);
        system.out.println("base64 编码: " + base64encoded);

        // ✅ 将 base64 字符串解码回原始字节
        byte[] decodedbytes = base64.getdecoder().decode(base64encoded);
        string decodedstring = new string(decodedbytes, standardcharsets.utf_8);
        system.out.println("解码后: " + decodedstring);
    }
}

2. 自定义工具类进行封装

为了方便在项目中使用，可以创建一个工具类来封装常用的转换方法。

import java.nio.charset.charset;
import java.nio.charset.standardcharsets;
import java.util.arrays;

public class stringutils {
    /**
     * 将字符串转换为字节数组，使用指定编码
     * @param str 待转换的字符串
     * @param charset 编码方式
     * @return 字节数组
     */
    public static byte[] stringtobytes(string str, charset charset) {
        if (str == null || charset == null) {
            return new byte[0];
        }
        return str.getbytes(charset);
    }

    /**
     * 将字节数组转换为字符串，使用指定编码
     * @param bytes 待转换的字节数组
     * @param charset 编码方式
     * @return 字符串
     */
    public static string bytestostring(byte[] bytes, charset charset) {
        if (bytes == null || charset == null) {
            return "";
        }
        return new string(bytes, charset);
    }

    /**
     * 将字符串转换为 utf-8 字节数组
     * @param str 待转换的字符串
     * @return utf-8 字节数组
     */
    public static byte[] toutf8bytes(string str) {
        return stringtobytes(str, standardcharsets.utf_8);
    }

    /**
     * 将 utf-8 字节数组转换为字符串
     * @param bytes 待转换的字节数组
     * @return 字符串
     */
    public static string fromutf8bytes(byte[] bytes) {
        return bytestostring(bytes, standardcharsets.utf_8);
    }

    // 测试方法
    public static void main(string[] args) {
        string teststr = "hello 世界 🌍";
        byte[] utf8bytes = toutf8bytes(teststr);
        string backtostr = fromutf8bytes(utf8bytes);

        system.out.println("原始: " + teststr);
        system.out.println("字节: " + arrays.tostring(utf8bytes));
        system.out.println("还原: " + backtostr);
        system.out.println("是否相等: " + teststr.equals(backtostr));
    }
}

3. 处理特殊字符和 emoji

现代应用中经常包含 emoji 表情符号。这些字符通常需要使用 utf-8 编码才能正确处理。

import java.nio.charset.standardcharsets;
import java.util.arrays;

public class emojiexample {
    public static void main(string[] args) {
        string emojistr = "hello 👋🌍! how are you? 😊";

        // ✅ 使用 utf-8 编码
        byte[] bytes = emojistr.getbytes(standardcharsets.utf_8);
        string decodedstr = new string(bytes, standardcharsets.utf_8);

        system.out.println("原始字符串: " + emojistr);
        system.out.println("字节数组 (utf-8): " + arrays.tostring(bytes));
        system.out.println("解码后: " + decodedstr);
        system.out.println("是否相等: " + emojistr.equals(decodedstr));
    }
}

4. 性能考量

虽然 standardcharsets 是推荐的，但在性能敏感的场景下，可以预先获取并缓存 charset 对象。

import java.nio.charset.charset;
import java.nio.charset.standardcharsets;

public class performanceexample {
    // 预先缓存常用编码
    private static final charset utf8_charset = standardcharsets.utf_8;
    private static final charset ascii_charset = standardcharsets.us_ascii;

    public static void main(string[] args) {
        string str = "hello world!";
        long starttime, endtime;

        // 使用缓存的 charset
        starttime = system.nanotime();
        for (int i = 0; i < 1000000; i++) {
            byte[] bytes = str.getbytes(utf8_charset);
            string result = new string(bytes, utf8_charset);
        }
        endtime = system.nanotime();
        system.out.println("使用预缓存 charset 耗时: " + (endtime - starttime) / 1000000.0 + " ms");

        // 使用 standardcharsets 直接访问
        starttime = system.nanotime();
        for (int i = 0; i < 1000000; i++) {
            byte[] bytes = str.getbytes(standardcharsets.utf_8);
            string result = new string(bytes, standardcharsets.utf_8);
        }
        endtime = system.nanotime();
        system.out.println("直接使用 standardcharsets 耗时: " + (endtime - starttime) / 1000000.0 + " ms");
    }
}

常见错误与解决方案

1. 编码不匹配导致的乱码

问题：读取文件时使用了错误的编码。

解决方案：始终明确指定编码。

// ❌ 错误做法
string content = new string(filebytes); // 使用默认编码

// ✅ 正确做法
string content = new string(filebytes, standardcharsets.utf_8);

2. 混合使用不同编码

问题：在同一个应用中混合使用不同的编码。

解决方案：在整个项目中统一使用一种编码（通常是 utf-8）。

3. 忽略异常处理

问题：未处理 unsupportedencodingexception。

解决方案：总是进行异常处理。

try {
    byte[] bytes = str.getbytes("utf-8");
} catch (unsupportedencodingexception e) {
    // 记录日志或使用默认编码
    byte[] bytes = str.getbytes(standardcharsets.utf_8);
}

总结

在 java 中处理 byte[] 和 string 之间的转换时，编码是一个核心且不容忽视的问题。正确的做法是始终明确指定编码方式，推荐使用 java.nio.charset.standardcharsets 中提供的常量。通过合理的编码选择和处理，我们可以避免乱码问题，确保程序的稳定性和可靠性。记住，编码不仅仅是技术细节，更是保证数据完整性和应用健壮性的关键。

以上就是java实现bytearray与string互转的常见转换方法的详细内容，更多关于java bytearray与string互转的资料请关注代码网其它相关文章！

Java实现ByteArray与String互转的常见转换方法

2025年12月23日 • Java •我要评论