ZipInputStream解压中文文件名失败？如何正确设置字符集？_Java

zipinputstream解压中文文件名失败？如何正确设置字符集？

zipinputstream解压中文文件名问题及解决方案

许多开发者在使用zipinputstream解压包含中文文件名或文件夹名的zip压缩包时，常常遭遇字符编码问题，导致解压失败，并提示类似“malformed input off : 1, length : 1”的错误。本文将深入分析此问题，并提供有效的解决方案。

问题根源在于zipinputstream构造方法中指定的字符集并非用于解压文件内部文件名编码，而是用于读取zip文件本身的中央目录信息。中央目录的编码取决于压缩包的创建环境和操作系统。windows系统通常使用gb2312或gbk编码，而macos和linux系统通常使用utf-8编码。

因此，如果一个zip压缩包是在windows系统下创建的，其中央目录很可能使用gbk编码。即使代码中指定了utf-8编码，zipinputstream仍然无法正确解析gbk编码的中央目录，从而导致解压失败。

解决方案：

针对windows系统创建的zip包，建议使用gbk编码读取中央目录：

fileinputstream input = new fileinputstream(targetpath);
zipinputstream zipinputstream = new zipinputstream(new bufferedinputstream(input), charset.forname("gbk"));

登录后复制

由于gbk编码兼容gb2312，此方法同样适用于gb2312编码的中央目录。

跨平台解决方案：

为了编写更健壮的跨平台兼容代码，推荐使用apache commons compress库。该库提供更强大的压缩/解压缩功能，能够自动处理不同编码的zip压缩包，有效避免因字符集差异导致的解压失败。它能自动检测并处理不同编码的中央目录信息，简化开发流程，并提升代码的可靠性。

以上就是zipinputstream解压中文文件名失败？如何正确设置字符集？的详细内容，更多请关注代码网其它相关文章！

如何处理在IDEA中连接Oracle数据库时出现的数字溢出错误？

intellij idea连接oracle数据库：数字溢出错误解决方案在使用intellij idea连接oracle数据库时，可能会遇到恼人的“数字溢出”错误... [阅读全文]

公司安全软件导致应用无法运行？如何排查和解决？

公司安全软件导致部分应用无法正常运行的排查与解决方法许多公司为了保障内部网络安全，会部署安全软件。然而，有时这些安全软件的防护措施过于严格，可能会导致一些常用的... [阅读全文]

@ResultType注解在MyBatis中如何正确使用？

在研究mybatis框架时，开发者们常常会遇到关于注解的各种问题，其中一个常见的问题是如何正确使用@resulttype注解。本文将详细探讨@resulttyp... [阅读全文]

如何解决使用Eclipse Paho的MqttAsyncClient连接本地EMQX时用户名密码认证失败的问题？

eclipse paho mqttasyncclient连接本地emqx用户名密码认证失败的解决方法本文档阐述了使用java和eclipse paho的mqtt... [阅读全文]

如何利用自然语言处理技术高效查询人员数据？

自然语言处理赋能人员数据高效查询企业高效管理和查询人员数据至关重要。本文探讨如何利用自然语言处理（nlp）技术，简化人员数据查询流程。假设我们拥有包含年龄、... [阅读全文]

子类如何通过继承父类的setName方法设置私有属性？

子类继承父类方法访问私有属性的机制java中的继承机制，特别是子类如何通过父类方法访问父类的私有属性，常常令人困惑。本文将深入探讨这一问题，并以一个具体的例子进... [阅读全文]


验证码：

验证码：

ZipInputStream解压中文文件名失败？如何正确设置字符集？

2025年03月29日 • Java •我要评论

相关文章:

发表评论