正则表达式,学习一下
网上是这么描述的,正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。它是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
下面来恶补下正则表达式的基本知识:
正式表达式-特殊字符(称为"元字符"):一些有特殊含义的字符,如.,简单的说就是表示任何字符串的意思。如果要查找字符串中的.符号,则需要对.进行转义,即在其前加一个\。那any\.thing就是匹配 any.thing。
下面列出了正则表达式中常见的"元字符":
. : 匹配除换行符 \n 之外的任意一个字符。如果要匹配 . ,需要使用 \. 。
\d : 匹配一个数字,等价于[0-9]。
\D : 匹配不是数字的字符。
\w : 匹配大小写字母或数字或下划线,等价于[a-zA-Z_0-9]。
\W : 匹配不是大小写字母、数字、下划线的字符。
\s : 匹配任意一个不可见字符,包括空格、制表符、换行符等。
\S : 匹配任意一个可见字符,除了上述不可见字符外的字符。
^ : 匹配字符串开始的位置。
$ : 匹配字符串结束的位置。
正则表达式-限定符(也叫做“量词”):限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。
它包括:
* : 匹配前面的子表达式0次或更多次,等价于{0,},例如"ko*"能匹配出字符串"k"、“ko”、“koo”、“kooo”等。
+ : 匹配前面的子表达式1次或更多次,等价于{1,},例如"ko+"能匹配出字符串“ko”、“koo”等,但是不能匹配“k”。
? : 匹配前面的子表达式0次或1次,等价于{0,1},例如"ko?"能匹配出字符串"k"、"ko",但是不能匹配"koo"。
{n} : n 是一个非负整数,匹配确定的 n 次。例如,“o{2}” 不能匹配 "Bob" 中的 "o",但是能匹配 "food" 中的两个 o。
{n,} : n 是一个非负整数,至少匹配n 次。例如,“o{2,}” 不能匹配 "Bob" 中的 "o",但是能匹配 "fooooooood" 中的所有 o。
{n,m} : m、n 均为非负整数,其中n <= m,最少匹配 n 次且最多匹配 m 次。例如,"o{1,6}" 将匹配 "fooooooood" 中的前6个 o。
这里需要注意,*、+限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。
另外,正则表达式还有一些特殊的语法,比如:
(xy) : 将()里面的字符作为整体进行匹配,括号里面的内容是一个子表达式或者叫分组。例如,"(ha)"就可以匹配"happy"中的"ha"。
[xy] : 匹配[]内所包含的任意一个字符。例如,"[xyz]"可以匹配"happy"中的"y"。
说了那么多,那我们怎么知道写的正则表达式是否正确匹配了我们要的数据呢?这里就需要借助正则表达式的验证工具。
我推荐可以用下这个,在线的,不用安装软件就可以使用,我觉得挺方便的,叫做“在线正则表达式测试”,网址是:http://tool.oschina.net/regex
在浏览器输入上面的网址,界面是这样的:
图1 在线正则表达式测试比如,右边还会提示常用的正则表达式,我们可以拿个“匹配中文字符”来测试一下。在第一个文本框我们输入hello你好,然后点击一下右边的“匹配中文字符”,正则表达式就会被自动填充了,我们再点击一下测试匹配按钮,就会看到测试结果,匹配到了两处,就是你,好:
图2 匹配中文字符的例子本篇主要是学习JMeter-正则表达式提取器的基础知识储备,希望对大家有所帮助。
补充:另一个正则表达式测试器