当前位置: 代码网 > it编程>前端脚本>Python > Python 正则表达式中的`^`和`[]`及常见含义

Python 正则表达式中的`^`和`[]`及常见含义

2025年06月24日 Python 我要评论
一、正则表达式:符号^^在正则表达式中有两种常见的含义,具体取决于它的位置:1. 在字符集 [ ] 的开头时,表示取反(negation)。例如:[^s]:匹配任何非空白字符。[^a-z]:匹配任何不

一、正则表达式:符号^

在正则表达式中有两种常见的含义,具体取决于它的位置:

1. 在字符集 [ ] 的开头时,表示取反(negation)。

例如:

  • [^s]:匹配任何非空白字符。
  • [^a-z]:匹配任何不在 a-z 范围内的字符。

2. 在字符集之外时,表示字符串的开始(anchor)。

例如:

  • ^https:匹配以 “https” 开头的字符串。
  • ^\d:匹配以数字开头的字符串。

总结:

  • 在 [ ] 内:取反。
  • 在 [ ] 外:字符串开始。
    需要根据上下文判断 ^ 的具体含义。

二、正则表达式:字符集[ ]

[ ] 在正则表达式中表示字符集(character set),用于匹配其中任意一个字符。下面详细讲解其具体用法和规则:

1. 基本用法

字符集 [ ] 中的每个字符都是独立的匹配选项。例如:

  • [abc]:匹配 ab 或 c 中的任意一个字符。
  • [0123456789]:匹配任意一个数字(等价于 [0-9])。

示例:

import re
text = "a1b2c3"
print(re.findall(r'[abc]', text))  # 输出: ['a', 'b', 'c']
print(re.findall(r'[0-9]', text))  # 输出: ['1', '2', '3']

2. 取反(negation)

如果 ^ 出现在字符集的开头(即 [^...]),表示匹配不在该字符集中的任意字符。例如:

  • [^abc]:匹配除了 abc 之外的任意字符。
  • [^0-9]:匹配非数字字符(等价于 \d)。

示例:

text = "a1b2c3!@#"
print(re.findall(r'[^abc]', text))  # 输出: ['1', '2', '3', '!', '@', '#']
print(re.findall(r'[^0-9]', text))  # 输出: ['a', 'b', 'c', '!', '@', '#']

3. 范围(range)

在字符集中,可以用 - 表示字符范围(需确保 - 不在开头或结尾,否则会被视为普通字符)。例如:

  • [a-z]:匹配任意小写字母。
  • [a-z]:匹配任意大写字母。
  • [0-9]:匹配任意数字(等价于 \d)。

示例:

text = "hello world 123"
print(re.findall(r'[a-z]', text))  # 输出: ['e', 'l', 'l', 'o', 'o', 'r', 'l', 'd']
print(re.findall(r'[a-z]', text))  # 输出: ['h', 'w']
print(re.findall(r'[0-9]', text))  # 输出: ['1', '2', '3']

4. 特殊字符在字符集中的处理

  • 普通元字符(如 *+?)在字符集中会被视为普通字符,无需转义。例如:
    • [*+]:匹配 * 或 +
  • 如果需要匹配 - 或 ],需注意:
    • - 放在开头或结尾(如 [a-] 或 [-a])。
    • ] 放在开头(如 []a])或转义(如 [\]])。

示例:

text = "a*b+c?d]"
print(re.findall(r'[*+?]', text))  # 输出: ['*', '+', '?']
print(re.findall(r'[]]', text))    # 输出: [']']

5. 与预定义字符类的关系

字符集 [ ] 可以实现类似预定义字符类(如 \d\w\s)的功能,但更灵活:

  • \d ≈ [0-9](数字)。
  • \w ≈ [a-za-z0-9_](单词字符)。
  • \s ≈ [\t\n\r\f\v](空白字符)。

示例:

text = "abc123 _!@#"
print(re.findall(r'\w', text))    # 输出: ['a', 'b', 'c', '1', '2', '3', '_']
print(re.findall(r'[a-za-z0-9_]', text))  # 效果相同

6. 与锚点 ^ 的区别

  • ^ 在字符集外表示字符串开头(如 ^abc 匹配以 abc 开头的字符串)。
  • ^ 在字符集内表示取反(如 [^abc] 匹配非 abc 的字符)。

示例:

text = "abc123 xyz"
print(re.findall(r'^abc', text))    # 输出: ['abc'](匹配开头)
print(re.findall(r'[^abc]', text))  # 输出: ['1', '2', '3', ' ', 'x', 'y', 'z'](取反)

总结

  • [ ]:字符集,匹配其中任意一个字符。
  • [^...]:取反字符集,匹配不在其中的字符。
  • -:在字符集中表示范围(如 [a-z])。
  • 注意与锚点 ^ 的区别,以及特殊字符的处理。

到此这篇关于python 正则表达式中的`^`和`[]`的文章就介绍到这了,更多相关python 正则表达式内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com