在 lua 的 string 库中的正则表达式
标题: 在 lua 的 string 库中的正则表达式
作者: 神梦无痕(email:smwh@vip.qq.com)
链接:
https://www.jianshu.com/p/4fdc274f3573
版权: 本人所有文章,都遵守“
署名-非商业性使用-相同方式共享 2.5 中国大陆”协议条款。
一.前提要了解一下 lua 的string几个方法
A、string
库中所有的字符索引从前往后是1,2,...
;从后往前是-1,-2,...
B、string
库中所有的function
都不会直接操作字符串,而是返回一个结果
string.len(s):返回字符串的长度.
string.lower(s):变小写.
string.upper(s):变大写.
string.rep(s,n):将 s 拷贝 n 份,并连接起来,返回.
string.sub(s,i [,j]):取 s 中从 i 开始到 j 为止的自字符串.默认 j 为长度 -i 表示倒数
-
1.
string.find(s, pattern, pos)
第1个参数:源字符串
第2个参数:待搜索之模式串
第3个参数:A hint, 从 pos 位置开始搜索
找到匹配返回:匹配串开始和结束的位置,否则返回 nil
-
2.
string.gsub(s, pattern, reps)
string.gsub(s, pattern, func)
第1个参数:源字符串
第2个参数:待替换之模式串
第3个参数:替换为 reps
返回 结果串 + 匹配数
--gsub也可以用拷贝捕获技巧
print(string.gsub("hello, world", "(o)", "%1-%1"))
--> hello-o, wo-orld 2
print(string.gsub("hello Lua", "(.)(.)", "%2%1"))
--> ehll ouLa 4
-- 注意匹配数用括号丢弃
function trim (s) return (string.gsub(s, "^%s*(.-)%s*$", "%1")) end
--string.gsub(s, pattern, func)
--第3个参数:自定义函数,对找到的匹配操作,并传出替换值
s, n = string.gsub("hello world", "l+", function(s) return "xxx" end)
--> l+一个或多个l ,所以替换了 ll 和 l 返回为2
print(s, n)
--> hexxxo worxxxd 2
- 3.
string.gfind
--返回一个迭代器,迭代器每执行一次,返回下一个匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) --> a=b
print(iter()) --> c=d
--通常用于泛性for循环,下面的例子结果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
- 4.下面的表列出了
Lua
支持的所有字符类
. 任意字符
%a 字母
%c 控制字符
%d 数字
%l 小写字母
%p 标点字符
%s 空白符
%u 大写字母
%w 字母和数字
%x 十六进制数字
%z 代表0的字符
--上面字符类的大写形式表示小写所代表的集合的补集。例如, '%A'非字母的字符:
- 5.模式串中的特殊字符
( ) . % + - * ? [ ^ $
'%' 用作特殊字符的转义字符
'%.' 匹配点
'%%' 匹配字符 '%'。转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。当对一个字符有疑问的时候,为安全起见请使用转义字符转义他。
用'[]'创建字符集
'[%w_]' 匹配字母数字和下划线
'[01]' 匹配二进制数字
'[%[%]]'匹配一对方括号
在'[]'中使用连字符'-'
'%d' 表示 '[0-9]';
'%x' 表示 '[0-9a-fA-F]'
'[0-7]' 表示 '[01234567]'
在'[]'开始处使用 '^' 表示其补集:
'[^0-7]' 匹配任何不是八进制数字的字符;
'[^\n]' 匹配任何非换行符户的字符。
'[^%s]' == '%S'
- 6.模式修饰符
+ 匹配前一字符1次或多次
* 匹配前一字符0次或多次;最长匹配
- 匹配前一字符0次或多次;最短匹配
? 匹配前一字符0次或1次
^ 匹配字符串开头
$ 匹配字符串结尾