当前位置: 代码网 > it编程>编程语言>正则表达式 > Java正则表达式如何提取以.com或.cn结尾的网址?

Java正则表达式如何提取以.com或.cn结尾的网址?

2025年03月30日 正则表达式 我要评论
java正则表达式高效提取文本信息java编程中,经常需要从文本中提取符合特定模式的内容。正则表达式为此提供了高效的解决方案。本文以一个案例演示如何利用java正则表达式提取特定信息。问题: 从包含多

java正则表达式如何提取以.com或.cn结尾的网址?

java正则表达式高效提取文本信息

java编程中,经常需要从文本中提取符合特定模式的内容。正则表达式为此提供了高效的解决方案。本文以一个案例演示如何利用java正则表达式提取特定信息。

问题: 从包含多个网址的文本中,仅提取以“.com”或“.cn”结尾的网址。

解决方案: 使用正则表达式www.s*?(com|cn)匹配以“www.”开头,并以“.com”或“.cn”结尾的字符串。www.匹配“www.”,s*?匹配任意非空白字符(非贪婪模式),(com|cn)匹配“.com”或“.cn”。pattern.case_insensitive标志确保匹配不区分大小写。

java代码示例:

string html = "<a>www.baidu.com</a><a>www.qq.com</a><a>www.aaa.cn</a>www.eee.cn";
string reg = "www\.\s*?(com|cn)";

pattern pattern = pattern.compile(reg, pattern.case_insensitive);
matcher matcher = pattern.matcher(html);
while (matcher.find()) {
    system.out.println(matcher.group());
}
登录后复制

输出结果:

www.baidu.com
www.qq.com
www.aaa.cn
www.eee.cn
登录后复制

此代码演示了如何编译正则表达式,使用matcher类进行匹配,并循环输出匹配结果。 通过调整正则表达式,可以灵活地提取不同模式的文本信息,实现高效的文本数据处理。

以上就是java正则表达式如何提取以.com或.cn结尾的网址?的详细内容,更多请关注代码网其它相关文章!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com