字符串替换函数

replaceOne(haystack, pattern, replacement)

用’replacement’子串替换’haystack’中第一次出现的’pattern’子串(如果存在)。
’pattern’和’replacement’必须是常量。

replaceAll(haystack, pattern, replacement), replace(haystack, pattern, replacement)

用’replacement’子串替换’haystack’中出现的所有的’pattern’子串。

replaceRegexpOne(haystack, pattern, replacement)

使用’pattern’正则表达式的替换。 ‘pattern’可以是任意一个有效的re2正则表达式。
如果存在与’pattern’正则表达式匹配的匹配项,仅替换第一个匹配项。
模式pattern可以指定为‘replacement’。此模式可以包含替代\0-\9
替代\0包含了整个正则表达式。替代\1-\9对应于子模式编号。要在模板中使用反斜杠\,请使用\将其转义。
另外还请记住,字符串字面值(literal)需要额外的转义。

示例1.将日期转换为美国格式:

  1. SELECT DISTINCT
  2. EventDate,
  3. replaceRegexpOne(toString(EventDate), '(\\d{4})-(\\d{2})-(\\d{2})', '\\2/\\3/\\1') AS res
  4. FROM test.hits
  5. LIMIT 7
  6. FORMAT TabSeparated
  1. 2014-03-17 03/17/2014
  2. 2014-03-18 03/18/2014
  3. 2014-03-19 03/19/2014
  4. 2014-03-20 03/20/2014
  5. 2014-03-21 03/21/2014
  6. 2014-03-22 03/22/2014
  7. 2014-03-23 03/23/2014

示例2.复制字符串十次:

  1. SELECT replaceRegexpOne('Hello, World!', '.*', '\\0\\0\\0\\0\\0\\0\\0\\0\\0\\0') AS res
  1. ┌─res────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
  2. Hello, World!Hello, World!Hello, World!Hello, World!Hello, World!Hello, World!Hello, World!Hello, World!Hello, World!Hello, World!
  3. └────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

replaceRegexpAll(haystack, pattern, replacement)

与replaceRegexpOne相同,但会替换所有出现的匹配项。例如:

  1. SELECT replaceRegexpAll('Hello, World!', '.', '\\0\\0') AS res
  1. ┌─res────────────────────────┐
  2. HHeelllloo,, WWoorrlldd!!
  3. └────────────────────────────┘

作为例外,对于空子字符串,正则表达式只会进行一次替换。
示例:

  1. SELECT replaceRegexpAll('Hello, World!', '^', 'here: ') AS res
  1. ┌─res─────────────────┐
  2. here: Hello, World!
  3. └─────────────────────┘

regexpQuoteMeta(s)

该函数用于在字符串中的某些预定义字符之前添加反斜杠。
预定义字符:\0, \\, |, (, ), ^, $, ., [, ], ?, *, +, {, :, -
这个实现与re2::RE2::QuoteMeta略有不同。它以\0 转义零字节,而不是\x00,并且只转义必需的字符。
有关详细信息,请参阅链接:RE2

来源文章