确定察看(Positive Lookaround)
下面四个是所谓的前向或后向断言。它们从当前的匹配向前或向后寻找需要的东西而不在匹配中包含它们。这些表达式匹配一个类似于“^”或“\b”的位置而不匹配任何文本,理解这个是很重要的。由于这个原因,他们也被称为“零宽度断言”。最好用例子来解释它们:
“(?=exp)”是“零宽度确定前向断言”。它匹配一个文本中在给定后缀之前的位置,但不在匹配中包含这个后缀:
22. \b\w+(?=ing\b) -- The beginning of words ending with "ing"
“(?<=exp)”是“零宽度确定后向断言”。它匹配在给定前缀后面的位置,但不在匹配中包含这个前缀:
23. (?<=\bre)\w+\b -- The end of words starting with "re"
下面这个例子可以用来重复向三位数为一组的数字中插入逗号的例子:
24. (?<=\d)\d{3}\b -- Three digits at the end of a word, preceded by a digit
下面是一个同时搜索前缀和后缀的例子:
25. (?<=\s)\w+(?=\s) -- Alphanumeric strings bounded by whitespace
否定察看(Negative Lookaround)
之前,我说明了怎样搜索一个不是特定字符或一个字符集合的成员的字符。那么如果我们想要简单的验证一个字符没有出现,但是不想匹配任何东西怎么办?例如,如果我们想要搜索其中“q”不是后跟着“u”的单词怎么办?我们可以尝试:
26. \b\w*q[^u]\w*\b -- Words with "q" followed by NOT "u"
运行例子你就会看到如果“q”是一个单词的最后一个字母就不会匹配,比如“Iraq”。这是因为“[^q]”总是匹配一个字符。如果“q”是单词的最后一个字符,它会匹配后面跟着的空白字符,所以这个例子中表达式结束时匹配两个完整的单词。否定察看可以解决这个问题,因为它匹配一个位置而不消耗任何文本。与确定察看一样,它也可以用来匹配一个任意复杂的子表达式的位置,而不仅仅是一个字符。我们现在可以做得更好:
27. \b\w*q(?!u)\w*\b -- Search for words with "q" not followed by "u"
我们使用“零宽度否定前向断言”,“(?!exp)”,只有当后缀“exp”没有出现时它才成功。下面是另一个例子:
28. \d{3}(?!\d) -- Three digits not followed by another digit
相似地,我们可以使用“(?<!exp)”,“零宽度否定后向断言”,来搜索文本中的一个位置,这里前缀“exp”没有出现:
29. (?<![a-z ])\w{7} -- Strings of 7 alphanumerics not preceded by a letter or space
这里是另一个使用后向的例子:
30. (?<=<(\w+)>).*(?=<\/\1>) -- Text
| 对此文章发表了评论 |

