您现在的位置: 无忧电子商务网 >> 信息学院 >> 程序开发 >> asp.net >> 正文

30分钟正则表达式指导

作者:佚名    信息学院来源:整理    点击数:    更新时间:2008-1-30 我要参与讨论

 

  当使用可选项时,顺序是很重要的因为匹配算法将试图先匹配最左面的选择。如果这个例子中的顺序颠倒过来,表达式将只能找到5位的邮政编码,而不会找到9位的。我们可以使用可选项来改进十位电话号码的表达式,允许包含区码无论是通过空白字符还是连字符划分的:

17. (\(\d{3}\)|\d{3})\s?\d{3}[- ]\d{4} -- Ten digit phone numbers, a better way

  分组

  圆括号可以用来划分一个子表达式来允许重复或者其他特殊的处理,例如:

18. (\d{1,3}\.){3}\d{1,3} -- A simple IP address finder

  表达式的第一部分搜索后面跟着一个“\.”的一个一位到三位的数字。这被放在圆括号中并且通过使用修饰符“{3}”被重复三次,后面跟着与之前一样的表达式而不带后缀部分。

  不幸的是,这个例子允许IP地址中被分隔的部分是任意的一位,两位,或三位数字,尽管一个合法的IP地址不能有大于255的数字。要是能够算术比较一个获取的数字N使N<256就好了,但是只用正则表达式是不能够办到的。下一个例子使用模式匹配测试了基于第一位数字的多种可选项来保证限制数字的取值范围。这表明一个表达式会变得很笨重,尽管搜索模式的描述是简单的。

19. ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?) -- IP finder

  一个“回引”用来搜索前面被一个分组捕获的已匹配文本的再现。例如,“\1”表示“匹配分组1中已捕获到的文本”。下面是一个例子:

20. \b(\w+)\b\s*\1\b -- Find repeated words

  它的运行过程是先捕获一个分组1中“(\w+)”表示的至少包含一个字母数字字符的字符串,但仅当它是一个单词的开始或结束字符时才行。然后它搜索任意数量的空白字符“\s*”后跟以被捕获的文本“\1”结尾的单词。

  在上面的例子中,想要替换分组“(\w+)”这种写法,我们可以把它写成“(?<Word>\w+)”来给这个分组命名为“Word”。一个对这个分组的回引可以写成“\k<Word>”。试试下面的例子:

21. \b(?<Word>\w+)\b\s*\k<Word>\b -- Capture repeated word in a named group

  通过使用圆括号,有很多可用的特殊用途的语法元素。一些最常用的归纳如下面这张表格:

捕获 (exp) 匹配exp并且在一个自动计数的分组中捕获它 (?<name>exp) 匹配exp并且在一个命名的分组中捕获它
(?:exp) 匹配exp并且不捕获它 察看 (?=exp) 匹配任何后缀exp之前的位置 (?<=exp) 匹配任何前缀exp之后的位置 (?!exp) 匹配任何未找到的后缀exp之后的位置 (?<!exp) 匹配任何未找到的前缀exp之前的位置 评论 (?#comment) 评论

表4 常用分组结构

  前两个我们已经说过了。第三个“(?

上一页  [1] [2] [3] [4] [5] [6] [7] [8] 下一页

在google里搜索更多30分钟正则表达式指导

Google
Web www.51ec.org
【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
我来说两句 对此文章发表了评论
  昵 称: *必填    ·注册用户·
  评 分: 1分 2分 3分 4分 5分     严禁发表危害国家安全、政治、黄色淫秽等内容的评论,用户需对自己在使用本网站服务过程中的行为承担法律责任。本站管理员有权保留或删除评论内容,评论内容只代表机友个人观点,与本网站立场无关。  
评 论
内 容

 
评论列表 (最新 评论仅限网友观点!)

供求信息




| 设为首页 | 加入收藏 | 关于我们 | 广告服务 | 联系方式 | 友情链接 | 版权申明