正则表达式——入门
写程序7年,从我身边接触到的人来看,相当多的程序员把正则表达式看得很高深,甚至觉得是一道不可跨越的鸿沟。
有此想法的原因很简单:只是因为你没有花上几个小时的时间去学习一下正则的基础。
对,只需要几个小时,你就能编写出自己需要的正则表达式。
为了引导这些不敢触碰正则的朋友,我特别写了这篇正则的入门文章,希望能够帮到你们。
正则表达式是什么?
比较正规的解释是:正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。
在这里,我希望使用一个更为通俗的自然语言来描述它:正则表达式就是用一类字符的统称来描述这一大批字符。举个例子,正则里说汉字,那么其实它就涵盖了所有的中国文字。
现在你是否明白了正则到底是个什么东西了吧?仍不明白?不要紧,继续往下看,文中会通过一些简单的实例来帮助你对正则的理解。
为什么要用正则表达式?
可以这么说,正则表达式能做的,都能够通过正常的编程来实现。那么我们为什么还要学习正则呢?原因很简单:
- 正则表达式能够很大幅度的简化代码,实现起来也更为顺手;
- 用正则表达式去处理字符串,代码更容易理解;
- 通常来说,正则表达式的速度远比自己写逻辑要高很多;
正则表达式要怎么使用?
正则表达式具体怎么使用取决于你用什么编程语言,我们先看大家都熟悉的Javascript.
var reg = new RegExp("^[a-z]+$"); //也可以写成:var reg = /^[a-z]+$/;
^:表示字符串的开始
[a-z]:表示任意小写的字母
+:表示前边的字母至少出现1次,上不封顶
$:表示字符串的结束
应用一:reg.test("abcd") //true
从头到尾都是小写的英文字母,所有匹配成功,返回true
应用二:reg.test("8ddde") //false
因为开头不是字母,所以匹配失败,返回false
前边所列举都是用正则去检测一个字符串是否是预期的规则,现则我们再用正则去获取一个大字符串中需要的内容。
var str = "正则表达式(Regular Expression)是对字符串操作的一种逻辑公式"
var reg = /[a-zA-z]+/g; //最后加个“g”表示查找所有符合条件的,不带“g”表示查找第一个符合条件的
var result = str.match(reg); //返回的result是一个数组,包含所有查找到的内容
// result[0]: Regular
// result[1]: Expression
正则表达式中的元字符
要写出正则表达式,一定要知道表达式中可以使用哪些字符,代表哪些意思。这好比“人类”代表黄种人、白种人、黑种人等。下边列出了所有的元字符和对于的描述。
参考我之前的CSDN博客:http://blog.csdn.net/sq_zhuyi/article/details/12848509
作者:朱会震