JavaScript 与正则表达式 -- 历史
上古时期
20世纪40年代,神经学家提出的一种神经系统的模型。
20世纪50年代,数学家斯蒂芬·科尔·克莱尼利用称之为“正则集合”(regular sets)的数学符号来描述此模型。
20世纪50年代,理论数学界对正则进行了充分的研究。
计算机中的应用
1968 年,肯·汤普逊(Kenneth Lane Thompson) 将此符号系统引入到了他的编辑器QED。
QED 是后来Unix中 ed 的基础,并最终成为独立工具grep;
混乱
在grep演变发展的同时,越来越多的开发者加入了对正则表达式的“改造”,也出现了越来越多的程序,比如:awk、lex、sed;因为没有标准,也没有谁出一份完整的文档,所以很多“看起来相似”的功能在很多软件中出现。
POSIX规范
1986年,POSIX为了解决正则表达式的混乱局面。把常见的流派分为基本型正则表达式(Basic Regular Expression,BRE)和扩展型正则表达式(Extended Regular Express,ERE)两大流派。
此时的正则表达式操作符还只是一些专业工具(如: sed, awk)提供的功能,Perl的出现把正则推向了更大的舞台。
Perl
1986年,一位大牛(Henry Spencer),用C语言编写了一个正则表达式包,可以很容易的被其他语言使用,后来被广泛引用。
Perl1.0是首个提供正则表达式操作符的脚本语言。
Perl2.0 ,正则引擎开始采用上文的 Henry 的正则表达式包升级版。
随后的,Perl经过几代的更新,于1994年10月发布的Perl5中对正则表达式进行了全面的修整,错误更少,提供了更多的新特性;
随着Perl的发展,其他编程语言如 Python,.NET, Ruby, PHP, C/C++,都有了自己的正则表达式包,并最终形成了另一个“标准”: 兼容Perl(Perl Compatible Regular Expression,PCRE);
1997年,又一位大牛(Philip Hazel) 开发了PCRE,一套兼容Perl正则表达高质量的库,其他开发人员可以吧PCRE整合到自己的语言或工具中,许多流行软件使用了 PCRE,如: PHP, Apache 2。
JavaScript
1999 年发布的ECMA 第三版 ,正式引入了正则表达式:
The current document defines the third edition of the Standard and includes powerful regular expressions, better string handling, new control statements, try/catch exception handling, tighter definition of errors, formatting for numeric output and minor changes in anticipation of forth coming internationalisation facilities and future language growth.
在ES3到最近的ES2018,RegExp 部分都有下面这句话:
The form and functionality of regular expressions is modelled after the regular expression facility in the Perl 5 programming language.
既然JavaScript的正则表达式是基于Perl5的,那撸起来应该是相对简单的了。