Groovy字符串与正则
2017-04-19 本文已影响1114人
zhaoyubetter
字符串
- 单引号,类似于Java中的String,不会对$进行处理,即就是字符串;
def h = 'Hello $ better' // 输出的 Hello $ better - 双引号,如果字符串中有$符号,会对$表达式进行先求值,没有则跟单引号类似;
def i = 128;
def str = 'Hello $i' // 输出的是 Hello 128 - 三引号,‘’‘XXX’‘’,就字符串进行换行输出;
字符串操作
可通过索引来获取字符串中的子串;
// 索引
def better = 'better'
better[2] // t
better[-1] // r index from end
println(better[0..2]) // bet
println(better[4..2]) // ett
// 方法,Groovy新增一些String的一些方法,如:center、reverse等等
def message = "better"
println(message.center(15)) // better 居中
println(message.center(15, "*")) // ****better*****
println(message.padLeft(15, "*")) // *********better
println(message.tokenize('e')) // [b, tt, r]
1..2
被称为范围(range)
groovy 中正则的定义:
在Groovy中 groovy 正则使用 ~'regex' 定义正则,也可以使用 // 来定义,如:
// ==== groovy 正则创建 ====
def regex = ~'better' // 创建正则,将字符串编译成 Pattern
def match = 'zhaoyubetter' =~ 'better' // 将操作符左边的字符串跟右边的Pattern进行局部匹配,返回为Mather
def match1 = 'zhaoyubetter' =~ regex
println(match.find()) // true
println(match1.find()) // true
// === 精确匹配 ==~(左边整个字符串与右边的模式) ==
// 类似 matcher.matches()
println( 'zhaoyubetter' ==~ 'better') // false
// ===== 支持 // 来定义正则 (意思是不要写2个\\)=====
regex = ~/\w+@\w+(\.\w+)+/
println(('zhaoyubetter@126.com' =~ regex).find()) // true
分组匹配
// ==== 分组匹配 ====
// Groovy 简化了matcher操作,可把Matcher对象看作一个二维矩阵。
// 第1维表示每一个与模式相匹配的字符串;
// 第2维表示每个匹配内的捕获组(capture group)
// android 中 为 xml 指定id的方式如下:
def str1 = "@+id/button1"
def str3 = "@id/button3"
def str2 = "@android:id/button2"
println("----- 分组获取 -----")
pattern = ~/@((\+id)|(id)|(android:id))\/(.*)/
matcher = str1 =~ pattern
println("分类1:${matcher[0][2]} ${matcher[0][3]} ${matcher[0][4]} ${matcher[0][5]}")
matcher = str2 =~ pattern
println("分类2:${matcher[0][2]} ${matcher[0][3]} ${matcher[0][4]} ${matcher[0][5]}")
matcher = str3 =~ pattern
println("分类3:${matcher[0][2]} ${matcher[0][3]} ${matcher[0][4]} ${matcher[0][5]}")
输出:
----- 分组获取 -----
分类1:+id null null button1
分类2:null null android:id button2
分类3:null id null button3
统计代码正则分析:
java 程序中,注释分为2种,一种 // ,一种 /**/(存在多行的情况),我们先来定义正则如下:
def regex1 = ~/^\s*\/\/.*/ // 表示注释1
def regex2 = ~/^\s*\/\*.*\*\/\s*$/ // 表示注释2
def regex2_start = ~/^\s*\/\*.*/ // 表示注释2头
def regex2_end = ~/.*\*\/\s*$/ // 表示注释2尾
def regex_space = ~/^\s*\s*$/ // 空行
// 可以使用下面的代码进行测试
def explainStr1 = 'def a = \'ddd\' //cc'
def explainStr2 = '/***wojfjsjf'
def explainStr3 = '*/ '
def explainStr4 = '/*adfdfsfdsdf*/'
def spaceLineStr = ' '
测试没问题后,进行程序类的编写如下:
class CodeLineCountRegex2 {
// ===== 注释类型 ===
// 我是注释1 单号
// ---> /* 我是注释2 头
// ---> */ 我是注释2 尾
def regex1 = ~/^\s*\/\/.*/ // 表示注释1
def regex2 = ~/^\s*\/\*.*\*\/\s*$/ // 表示注释2
def regex2_start = ~/^\s*\/\*.*/ // 表示注释2头
def regex2_end = ~/.*\*\/\s*$/ // 表示注释2尾
def regex_space = ~/^\s*\s*$/ // 空行
def explainLine = 0
def codeLine = 0
def spaceLine = 0
def regex_begin = false // 是否注释2开始了
// 文件的递归遍历
def codeLineCount(File file) {
if (file.exists()) {
if (file.isDirectory()) {
file.eachFile { current ->
codeLineCount(current)
}
} else {
anylise(file)
}
}
}
// 分别分析每一个文件
def anylise(file) {
file.each { line ->
if (regex_begin) { // 是否注释2开始了
explainLine++
if ((line =~ regex2_end).matches()) {
explainLine++
regex_begin = false
}
} else {
if ((line =~ regex1).matches()) {
explainLine++
} else if ((line =~ regex2).matches()) {
explainLine++
} else if ((line =~ regex2_start).matches()) {
regex_begin = true
} else if ((line =~ regex_space).matches()) {
spaceLine++
} else {
codeLine++
}
}
}
}
}
测试程序如下:
def file = new File("/Users/zhaoyu/Documents/Java/Pattern/src/com/better/groovy/base/CharTimes.groovy")
if(file.exists()) {
println("文件存在")
CodeLineCountRegex2 regex2 = new CodeLineCountRegex2()
regex2.codeLineCount(file)
println("行数:${regex2.codeLine}")
println("注释:${regex2.explainLine}")
println("空行:${regex2.spaceLine}")
}