13. 字符串

2017-12-21  本文已影响0人  simonyang777

1.不可变

String 类中每一个看起来会修改 String 值的方法,实际上都是创建了一个全新的 String 对象,以包含修改后的字符串内容。

每当把 String 对象作为方法的参数时,都会复制一份引用,而该引用所指的对象其实一直待在单一的物理位置上,从未动过。

书里提到了一句比较让我受启发的话:

对于一个方法而言,参数是为该方法提供信息的,而不是想让该方法改变自己的。

2. 重载「+」与 StringBuilder

之所以能使用「+」连接字符串,是因为 String 对象的「+」和「+=」是 Java 中仅有的两个重载过的操作符,而 Java 并不允许程序员重载任何操作符。
通过查看反编译生成的 JVM 字节码,就会发现,「+」连接字符串,实际上是编译器自动用了 StringBuilder 的 append() 方法进行连接,这样更高效。但在循环体里直接使用「+」连接字符串的话,效率就会比较低,因为这样每次执行「+」都会创建一个新的 StringBuilder 对象,因而需要在循环体外创建 StringBuilder,通过 append()方法连接字符串。

3.String 上的操作

String 有一系列的操作方法,下面就列举一些常用的:

方法 参数,重载版本 应用
length() Sring 中字符的个数
toCharArray() 生成一个 char[],包含 String 的所有字符
substring() 起始索引;起始索引+终点坐标 返回一个新的 String,以包含参数制定的子字符串
trim() 将 String 两段的空白自负删除后,返回一个新的 String 对象。如果没有改变发生,则返回原始的 String
contains 要搜索的 CharSequence 如果该 String 对象包含参数的内容,则返回 true

4.String.format(String format, Object... args)

这个方法用来生成格式化的 String 对象。
例:

int x = 3;
int y = 5;
System.out.println(String.format("Row 1: [%d, %d]", x, y));
//输出结果为 Row 1: [3, 5]

这里的占位符 %d 称作格式修饰符,不仅能表示数值插入的位置,也能表示数值的类型,%d表示要插入的值是整型,常用的有一下几种:

符号 类型
d 整数型(十进制)
c Unicode 字符
b Boolean 值
s String
f 浮点型(十进制)
e 浮点数(科学计数)
x 整数(十六进制)
h 散列码(十六进制)
% 字符"%"

5.正则表达式

由于书本涉及的内容比较多,这里主要用于摘录一些常用的语法。详情请参考 JDK 文档 java.util.regex 包中的 Pattern 类。

字符

符号 含义
B 指定字符B
\xhh 十六进制值为 oxhh 的字符
\uhhhh 十六进制表示为 oxhhhh 的 Unicode 字符
\t 制表符 Tab
\n 换行符(NewLine)
\r 回车(Return)
\f 换页(FormFeed)
\e 转义(Escape)

字符类

符号 含义
. 任意字符
[abc] 包含a、b 和 c 的任何字符(和 a|b|c|作用相同)
[^abc] 除了a、b 和 c 之外的任何字符
[a-zA-Z] 从 a 到 z 或从 A 到 Z 的任何字符
[abc[hij]] 任意 a、b、c、h、i 和 j 字符
[a-z]&&[hij] 任意 h、i 或 j
\s 空白符(空格、tab、换行、换页、回车)
\S 非空白符([^\s])
\d 数字[0-9]
\D 非数字[^0-9]
\w 词字符[a-zA-Z0-9]
\W 非词字符[^\w]

边界匹配符

字符 含义
^ 一行的起始
$ 一行的结束
\b 词的边界
\B 非词的边界
\G 前一个匹配的结束

量词

贪婪型 勉强型 占有型 如何匹配
X? X?? X?+ 一个或零个 X
X* X*? X*+ 零个或多个 X
X+ X+? X++ 一个或多个 X
X{n} X{n}? X{n}+ 恰好 n 次 X
X{n,} X{n,}? X{n,}+ 至少 n 次 X
X{n,m} X{n,m}? X{n,m}+ X 至少 n 次,且不超过 m 次
上一篇下一篇

猜你喜欢

热点阅读