模式匹配

MySQL提供了一个标准的SQL模式匹配,和基于扩展的正则表达式的模式匹配Unix工具(如vi,grep,sed)一样。

SQL模式匹配可以使用“_“来匹配任意单个字符,”%“可以用来匹配任意数量(包含0个字符)的字符。在MySQL中,SQL模式匹配的大小写默认是不敏感的,以下有一些例子,当你在使用SQL模式时,不要使用 = 或 <>,而是使用LIKE 或 NOT LIKE。

要找到以字符“b"开头的名字:

  1. mysql> SELECT * FROM pet WHERE name LIKE 'b%';
  2. +--------+--------+---------+------+------------+------------+
  3. | name | owner | species | sex | birth | death |
  4. +--------+--------+---------+------+------------+------------+
  5. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  6. | Bowser | Diane | dog | m | 1989-08-31 | 1995-07-29 |
  7. +--------+--------+---------+------+------------+------------+

找到以“fy”结尾的名字:

  1. mysql> SELECT * FROM pet WHERE name LIKE '%fy';
  2. +--------+--------+---------+------+------------+-------+
  3. | name | owner | species | sex | birth | death |
  4. +--------+--------+---------+------+------------+-------+
  5. | Fluffy | Harold | cat | f | 1993-02-04 | NULL |
  6. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  7. +--------+--------+---------+------+------------+-------+

找到名字包含字符“w”的名字:

  1. mysql> SELECT * FROM pet WHERE name LIKE '%w%';
  2. +----------+-------+---------+------+------------+------------+
  3. | name | owner | species | sex | birth | death |
  4. +----------+-------+---------+------+------------+------------+
  5. | Claws | Gwen | cat | m | 1994-03-17 | NULL |
  6. | Bowser | Diane | dog | m | 1989-08-31 | 1995-07-29 |
  7. | Whistler | Gwen | bird | NULL | 1997-12-09 | NULL |
  8. +----------+-------+---------+------+------------+------------+

使用5个“_“模式字符,来找到包含5个字符的名字:

  1. mysql> SELECT * FROM pet WHERE name LIKE '_____';
  2. +-------+--------+---------+------+------------+-------+
  3. | name | owner | species | sex | birth | death |
  4. +-------+--------+---------+------+------------+-------+
  5. | Claws | Gwen | cat | m | 1994-03-17 | NULL |
  6. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  7. +-------+--------+---------+------+------------+-------+

MySQL提供的其他模式匹配类型是使用扩展的正则表达式,当你使用这个类型来测试一个匹配,要使用REGEXP和NOT REGEXP操作(或者RLIKE和NOT RLIKE,他们是同意詞)。

下面的列表描述了一些扩展正则表达式的特征:

  • “.” 匹配任意单个字符.

  • 一个字符类“[…]"匹配括号里的任意字符,例如,"[abc]"匹配“a","b",或"c",要指定字符范围,可以使用“-",例如,“[a-z]"匹配任意字母,而“[0-9]"匹配任意数字。

  • "匹配0个或多个在它前面的东西。例如,“x“匹配任意个x字符,"[0-9]"匹配任意个数字,“."匹配任意个字符。

  • 一个REGEXP模式匹配成功的条件是,模式在测试值中的任意地方匹配即可。(这与LIKE模式匹配不同,LIKE模式匹配成功需要匹配整个值)。

  • 想让模式匹配测试值的开头或结尾,可以使用“^"开头作为模式的开头或用“$"作为模式的结尾。

为了验证扩展的正则表达式是如何工作的,在这使用REGEXP对前面使用LIKE查询进行重写。

使用“^“来匹配,找到以“b“开头的名字

  1. mysql> SELECT * FROM pet WHERE name REGEXP '^b';
  2. +--------+--------+---------+------+------------+------------+
  3. | name | owner | species | sex | birth | death |
  4. +--------+--------+---------+------+------------+------------+
  5. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  6. | Bowser | Diane | dog | m | 1989-08-31 | 1995-07-29 |
  7. +--------+--------+---------+------+------------+------------+

如果你真的想强制REGEXP比较为大小写敏感,可以使用BINARY关键詞来把字符串转换成二进制字符串。以下这个查询只匹配以小写字母“b“开头的名字:

  1. mysql> SELECT * FROM pet WHERE name REGEXP BINARY '^b';

要找到以"fy"结尾的名字,使用“$“来匹配名字的结尾:

  1. mysql> SELECT * FROM pet WHERE name REGEXP 'fy$';
  2. +--------+--------+---------+------+------------+-------+
  3. | name | owner | species | sex | birth | death |
  4. +--------+--------+---------+------+------------+-------+
  5. | Fluffy | Harold | cat | f | 1993-02-04 | NULL |
  6. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  7. +--------+--------+---------+------+------------+-------+

要找到名字包含一个"w"的名字,使用这个查询:

  1. mysql> SELECT * FROM pet WHERE name REGEXP 'w';
  2. +----------+-------+---------+------+------------+------------+
  3. | name | owner | species | sex | birth | death |
  4. +----------+-------+---------+------+------------+------------+
  5. | Claws | Gwen | cat | m | 1994-03-17 | NULL |
  6. | Bowser | Diane | dog | m | 1989-08-31 | 1995-07-29 |
  7. | Whistler | Gwen | bird | NULL | 1997-12-09 | NULL |
  8. +----------+-------+---------+------+------------+------------+

因为一个正则表达式的模式的匹配,是不管发生在值的哪个位置,在前面查询中,它不需要像使用一个SQL模式,放一个通配符在模式的两端,然后来匹配整个值。

要找到只包含5个字符的名字,使用“^"和“$"来匹配名字的开头和结尾,且放5个“."在中间。如下所示:

  1. mysql> SELECT * FROM pet WHERE name REGEXP '^.....$';
  2. +-------+--------+---------+------+------------+-------+
  3. | name | owner | species | sex | birth | death |
  4. +-------+--------+---------+------+------------+-------+
  5. | Claws | Gwen | cat | m | 1994-03-17 | NULL |
  6. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  7. +-------+--------+---------+------+------------+-------+

你也可以使用{n}(重复n次)操作符来写前面的查询:

  1. mysql> SELECT * FROM pet WHERE name REGEXP '^.{5}$';
  2. +-------+--------+---------+------+------------+-------+
  3. | name | owner | species | sex | birth | death |
  4. +-------+--------+---------+------+------------+-------+
  5. | Claws | Gwen | cat | m | 1994-03-17 | NULL |
  6. | Buffy | Harold | dog | f | 1989-05-13 | NULL |
  7. +-------+--------+---------+------+------------+-------+

更多的正则表达式的语法信息,请看Section 13.5.2, “Regular Expressions”

原文: https://strongyoung.gitbooks.io/mysql-reference-manual/content/tutorial/creating_using_database/pattern_match.html