MySQL正则表达式匹配

729 查看

概述

正则表达式和MySQL有何关系?正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL用where子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤select检索出的数据。

表达式语法

基本字符匹配

基本语法如下所示:

select prod_name from products where prod_name regexp '1000'

上面的语句作用是检索列prod_name中包含文本1000的所有行。

select prod_name from products where prod_name regexp '.000'

上面的语句中的.是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,1000和2000都匹配且返回。

PS:MySQL中的正则表达式匹配不区分大小写。为区分大小写,可使用BINARY关键字,如:

where prod_name regexp binary 'jetpack .000'

进行OR匹配

为搜索两个串之一,使用|,如下所示:

select prod_name from products where prod_name regexp '1000|2000|3000'

匹配几个字符之一

匹配任何单一字符。但是,如果你只想匹配特定的字符,怎么办?可通过指定一组[]括起来的字符完成,如下所示:

select prod_name from products where prod_name regexp '[123] Ton' 

匹配范围

集合可用来定义要匹配的一个或多个字符。例如,下面的集合将匹配数字0到9:

[0123456789]

为了简化这种类型的集合,可使用-来定义一个范围。下面的式子功能等同于上述数字列表:

[0-9]

范围不限于完整的集合,[1-3]和[6-9]也是合法的范围。此外,范围不一定只是数值的,[a-z]匹配任意字母字符。

匹配特殊字符

为了匹配特殊字符,必须用\\为前导。\\-表示查找-\\.表示查找.。这种处理就是所谓的转义,正则表达式内具有特殊意义的所有字符都必须以这种方式转义。这包括.|[]\等。

匹配字符类

存在找出你自己使用的数字、所有字母字符或所有数字字母字符等匹配。为了更方便的工作,可以使用预定义的字符集,称为字符类。表列出了字符类以及他们的含义:

说明
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符
[:blank:] 空格和制表
[:cntrl:] ASCII控制字符
[:digit:] 任意数字(同[0-9])
[:print:] 任意可打印字符
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a - z])
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中任意字符
[:space:] 包括空格在内的任意空白字符
[:upper:] 任意大写字母
[:xdigt:] 任意十六进制

匹配多个实例

目前为止使用的所有正则表达式都视图匹配单词出现。如果存在一个匹配,改行被检索出来,如果不存在,检索不出任何行。但是有需要对匹配的数目进行更强的控制。例如,你可能需要寻找所有的数,不管书中包含多少个字。

这可以用正则的表达式重复元字符来完成。

元字符 说明
* 0个或多个匹配
+ 一个或多个匹配
? 0个或一个匹配
{n} n个数目的匹配
{n,} n个以上的匹配
{n,m} n~m个数目的匹配(m不超过255)

定位符

目前为止的所有例子都是匹配一个串中任意位置的文本。为了匹配特定位置的文本,需要使用下面给出的定位符:

元字符 说明
^ 文本的开始
$ 文本的结尾
[[:&lt:]] 词的开始
[[:>:]] 词的结尾