43人参与 • 2025-05-18 • 正则表达式
所谓正则表达式(regular expression,简称regex
或regexp
)是一种用于匹配字符串中字符组合的模式描述工具。它通过一系列特殊的字符和符号来定义一种约定俗成的规则,用于查找、匹配、替换或验证字符串中的特定内容。在表单提交验证、路由映射、文本处理等方面大放异彩,基本上所有编程语言都有特定的一套正则机制以供程序员使用。
正则表达式由普通字符和特殊符号组成,一共可以分为两种大类。首先是元字符,由特殊符号组成,代表的是正则匹配中的匹配准则。转义字符通常由特殊符号\
+字符组成,是某种字符表达类型的统称,当匹配内容中本身带有\
时,需要再添加一个转义,例如\\
。
.
:匹配任意一个字符(除了换行符)。*
:匹配零次或多次的字符或子模式。+
:匹配一次或多次的字符或子模式。?
:匹配零次或一次的字符或子模式。{n}
:匹配重复n次的字符或子模式。{n,}
:匹配重复≥n次的字符或子模式。{n,m}
:匹配重复n到m次的字符或子模式。[]
:匹配方括号内的任意一个字符。[^]
:匹配不在方括号内的任意一个字符。^
:表示匹配字符串以…开头。$
:表示匹配字符串以…结尾。()
:分组,用于拆解匹配的内容。|
:逻辑或,表示匹配多种模式中的任意一个。-
:当其不在[]
内则就代表字符-
,在[]
内表示范围,例如[a-z]
表示任意小写字符。\d
:匹配任意数字字符(0-9)。\w
:匹配任意字母或数字或下划线字符(等价于 [a-za-z0-9_]
)。\s
:匹配任意空白字符(空格、制表符、换行符等)。\b
:匹配单词的开始与结束,例如\bword\b
可以匹配字符串中的整个单词word
,而不会混淆其他包含word
的内容。\d
:匹配任意非数字字符。\w
:匹配任意非字母、数字、下划线字符(等价于 [^a-za-z0-9_]
)。\s
:匹配任意非空白字符。\b[a-za-z0-9._%+-]+@[a-za-z0-9.-]+\.[a-z|a-z]{2,}\b
解释:匹配以字母、数字、点号、下划线等开头(可出现一次或多次),后跟@
,再跟转义的.
,最后以域名和顶级域名(字母且至少有两个字符)结尾。
\d{4}-\d{2}-\d{2}
解释:yyyy-mm-dd,匹配四个数字,跟-
,后跟两个数字,再跟-
,最后又是两个数字。
^1[3-9]\d{9}$
解释:以1
开头,第二位是3
到9
之间的数字,后面跟着九位数字结尾。
<[^>]+>(.*)</[^>]+>
解释:<xxx>…</xxx>。
在sql中若要应用正则表达式完成字符串查找功能,筛选出满足条件的记录时:
select * from 表名 where 字符串字段 regexp '正则表达式';
注意:仅字符串字段支持使用regexp
+正则语句进行查找功能。
在sql中若要应用正则表达式完成字符串替换功能时:
select regexp_replace(str, pattern, replace_str, occurrence) from 表名;
其中:
str
:表示需要应用正则替换的字符串表达;pattern
:表示正则表达式,需要带上英文引号;replace_str
:表示当匹配到样式后需要将其替换的新字符串表达;occurrence
:取值为整型常量,表示替换的程度,该值取0时替换掉所有满足正则条件的匹配子串,大于0时表示将第几个满足正则条件的匹配子串替换。例题: 查找有效邮箱的用户
一个有效的电子邮件具有前缀名称和域,其中:
_
,点 .
和/
或破折号-
;@leetcode.com
。代码:
select user_id, name, mail from users where mail regexp '^[a-za-z][a-za-z0-9_.-]*\\@leetcode\\.com$';
到此这篇关于sql中字符串正则表达式常见示例代码的文章就介绍到这了,更多相关sql字符串正则表达式内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论