当前位置: 代码网 > it编程>编程语言>正则表达式 > 用正则表达式匹配字符串中汉字及中文标点符号

用正则表达式匹配字符串中汉字及中文标点符号

2024年05月18日 正则表达式 我要评论
问题:在写项目时遇到需要匹配字符串中所有的汉字并且包括简单的中文标点符号比如:匹配下面这个完成的字符串网上能够查到很多匹配汉字的正则从结果可以看出上面写的正则没有匹配到标点符号,,所以将完整的字符串(

问题:

在写项目时遇到需要匹配字符串中所有的汉字并且包括简单的中文标点符号

比如:

匹配下面这个完成的字符串

网上能够查到很多匹配汉字的正则

从结果可以看出上面写的正则没有匹配到标点符号,,所以将完整的字符串(str)分隔开了

又从网上查找匹配中文标点的正则

ps:

如果上面没有想要的标点符号,可以上网查找将中文符号转换成unicode编码添加在表达式中即可

将刚才编写的正则表达式进行下简单的修改

可以看到这次结果是我们想要的形式,整个字符串都匹配到了~

补充:

unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。 

\pp 其中的小写 p 是 property 的意思,表示 unicode 属性,用于 unicode 正表达式的前缀。 

大写 p 表示 unicode 字符集七个字符属性之一:标点字符。 

其他六个是 

  • l:字母; 
  • m:标记符号(一般不会单独出现); 
  • z:分隔符(比如空格、换行等); 
  • s:符号(比如数学符号、货币符号等); 
  • n:数字(比如阿拉伯数字、罗马数字等); 
  • c:其他字符 

总结

到此这篇关于用正则表达式匹配字符串中汉字及中文标点符号的文章就介绍到这了,更多相关正则匹配汉字及中文标点符号内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com