关闭

正则表达式后行断言 • 探索 ES2018 和 ES2019

时间: 2018-07-12阅读: 1563标签: 正则

RegExp 后行断言

本章将解释由Gorkem Yakin,Nozomu Katō,Daniel Ehrenberg等人给出的RegExp 后行断言(Lookbehind Assertion)提案。

一个 先后行断言(Lookaround Assertion)是正则表达式中的一个构造,明确了当前位置的前后字符序列,但没有其他副作用。亦称为零宽断言(Zero-width Assertion)。

当前 JavaScript 唯一支持的 Lookaround Assertion 是 先行断言(Lookahead Assertion),其匹配当前位置接下来的字符序列,而本章描述的 后行断言 提案匹配的是当前位置前面的字符序列。


先行断言

正则表达式中的先行断言意味着:后续字符序列必须与断言相匹配,但没有其他副作用。即,不捕获任何东西,且匹配到的字符串不包含断言部分。

以如下正则表达式为例:

const RE_AS_BS = /aa(?=bb)/;

它匹配字符串 'aabb',但是匹配到的内容是不包含 'bb' 的:

const match1 = RE_AS_BS.exec('aabb');
console.log(match1[0]); // 'aa'

而且,它还不匹配那种没有两个 'b' 的字符串:

const match2 = RE_AS_BS.exec('aab');
console.log(match2); // null

一个负向先行断言(Negative Lookahead Assertion)意味着后续字符序列必须与该断言不匹配 。例如:

> const RE_AS_NO_BS = /aa(?!bb)/;
> RE_AS_NO_BS.test('aabb')
false
> RE_AS_NO_BS.test('aab')
true
> RE_AS_NO_BS.test('aac')
true


后行断言

后行断言与先行断言的工作方式类似,但是方向相反。


正向后行断言

对于一个正向后行断言(Positive Lookbehind Assertion)来说,当前位置的前继字符序列必须与该断言匹配(没有其他副作用)。

const RE_DOLLAR_PREFIX = /(?<=\$)foo/g;
'$foo %foo foo'.replace(RE_DOLLAR_PREFIX, 'bar');
    // '$bar %foo foo'

正如你所见,仅仅当前面是美元符号的那个 'foo' 被替换了。另外你也看到,因为美元字符后面的字符序列('foo')完全被'bar'替换掉了,所以美元符号不是匹配结果的一部分。

不使用后行断言而想达到同样结果的实现方式就没这么优雅:

const RE_DOLLAR_PREFIX = /(\$)foo/g;
'$foo %foo foo'.replace(RE_DOLLAR_PREFIX, '$1bar');
    // '$bar %foo foo'

如果前继字符也在上一个匹配中时,这种实现方式就不起作用了。

> 'a1ba2ba3b'.match(/(?<=b)a.b/g)
[ 'a2b', 'a3b' ]


负向后行断言

负向后行断言(Negative Lookbehind Assertion)仅仅当前位置的前继字符序列与断言 不匹配 时才匹配,并无其他副作用。例如:

const RE_NO_DOLLAR_PREFIX = /(?<!\$)foo/g;
'$foo %foo foo'.replace(RE_NO_DOLLAR_PREFIX, 'bar');
    // '$foo %bar bar'

如果不使用后行断言的话,要达到同样的结果,是没有其他简单的(一般的)实现方式。


总结

在正则表达式的尾部,使用先行断言最有意义。而在正则表达式的开头,使用后行断言最有意义。

使用先后行断言的用例有:

  • replace()
  • match() (尤其当正则表达式有修饰符 /g)
  • split() (注意 ' b,c' 开始处的空格):

    > 'a, b,c'.split(/,(?= )/)
    [ 'a', ' b,c' ]
    

除了上述用例外,你也随时可以在正则表达式中使用断言。


进一步阅读


原文链接: exploringjs.com  
翻译来源:www.zcfy.cc


站长推荐

1.云服务推荐: 国内主流云服务商,各类云产品的最新活动,优惠券领取。地址:阿里云腾讯云华为云

2.广告联盟: 整理了目前主流的广告联盟平台,如果你有流量,可以作为参考选择适合你的平台点击进入

链接: http://www.fly63.com/article/detial/922

从vue模板解析学习正则表达式

最近在看vue的模板解析成render这一块,顺便补一下正则的知识。attribute这段正则很长,他的主要作用是匹配标签里的指令,可以分几个分组来解读

ES6正则的扩展

参数为字符串, 那么第二个参数表示正则表达式的修饰符,如下:字符串对象共有4个方法,可以使用正则表达式: match()、 replace()、search() 和 split()。

javascript较全常用的表达正则验证,js中采用test()方法

正则表达式是一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。本文整理了JS较全且实用正则表达式。

JS常用正则表达式备忘录

正则表达式或regex用于匹配字符串的各个部分 下面是我创建正则表达式的备忘单。匹配正则使用 .test() 方法,匹配多个模式使用操作符号 |,使用i标志表示忽略大小写

javascript 正则表达式之分组与前瞻匹配详解

本文主要讲解javascript 的正则表达式中的分组匹配与前瞻匹配的,需要对正则的有基本认识。分组匹配:捕获性分组匹配、非捕获性分组匹配。前瞻匹配:正向前瞻匹配: (?=表达式) 后面一定要匹配有什么、反向前瞻匹配: (?!表达式) 后面一定不能要有什么

js使用正则过滤emoji表情符号

手机端常常会遇到用户输入框,输入emoji,如果是数据库是UTF8,会遇到报错,原因是:UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去。

常用正则表达式

将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。^匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,$匹配输入字符串的结束位置

精准准确的统一社会信用代码正则(js)

统一代码为18位,统一代码由十八位的数字或大写英文字母(不适用I、O、Z、S、V)组成,由五个部分组成:第一部分(第1位)为登记管理部门代码,9表示工商部门;(数字或大写英文字母)

前端正则表达式书写

/正则表达式/修饰符/i (忽略大小写),/g (全文查找出现的所有匹配字符),/m (多行查找),/gi(全文查找、忽略大小写),/ig(全文查找、忽略大小写),不写修饰符默认只匹配一个

一次性搞懂JavaScript正则表达式之引擎

我们说正则表达式是语言无关的,是因为驱动正则表达式的引擎是相似的。鉴于正则表达式是一种古老的语法,正则匹配的性能不是很高的么?匹配到就是匹配到,没匹配到就是没匹配到,怎么会在里面走不出来了呢?

点击更多...

内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!