正则表达式

2018-11-16  本文已影响0人  DDDDavid
符号 描述 说明
[\u4e00-\u9fa5] 中文的字符集合 但是hive在hive执行中会被转义,因此需要增加一次java的转义字符才能够正确使用[\\\u4e00-\\\u9fa5]
[a-zA-Z] 英文
[0-9] 数字
^ 字符串开始
$ 字符串结束
\ 转义
* 0次或多次
+ 1次或多次
? 0次或1次
|
{ } 表示出现次数
[ ] 表示某些字符允许在一个字符串中某一个特定位置出现
( ) 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。
上一篇 下一篇

猜你喜欢

热点阅读