String问题

2018-12-29 本文已影响8人 please边去

Java中有一个String类，特别让人伤脑筋。因为它可以直接赋值，也可以new一下用构造器生成对象，还可以用加号拼接……这些不同的方式到底有什么区别？本文是个人学习的一些总结，也希望能用最通俗的语言让大家明白这个类。

一、字符串的创建

字符串创建有两种方式，分别来看看这两种方式有何区别：

1. 字面量赋值创建：

String str1 = "hello";
String str2 = "hello";
String str3 = "world";

这样创建字符串，首先会去常量池里找有没有这个字符串，有就直接指向常量池的该字符串，没有就先往常量池中添加一个，再指向它。图解：

image.png
2. 用new创建：

String str1 = new String("hello");
String str2 = new String("hello");
String str3 = new String("world");

new一个字符串时，做了两件事。首先在堆中生成了该字符串对象，然后去看常量池中有没有该字符串，如果有就不管了，没有就往常量池中添加一个。图解：

image.png

所以当问到“执行上面那三行代码创建了几个对象”这样的问题就很简单了，堆中三个常量池中两个，总共是5个。
小结：这两种方式创建出来的，一个在堆中，一个在常量池中，所以它们之间用 == 比较肯定是false。

二、字符串的拼接：

字符串可以直接用加号进行拼接，但是也有几种不同的情况。

1. 常量拼接

String str = "hello" + "world";

对于这种加号两边都是常量的，在编译阶段就会自动拼接，变成

String str = "helloworld";

所以就会去常量池找"helloworld"，有就直接指向它，没有就在常量池创建再指向。

2. 有final的拼接：

final String str1 = "hello";
final String str2 = "world";
String str3 = str1 + str2;

因为final修饰的变量就是常量，所以在编译期直接会变成

String str3 = "hello" + "world";

再根据常量拼接规则可知最终就变成

String str3 = "helloworld";

3. 变量和常量拼接：
变量和常量拼接的时候，底层会调用StringBuilder的append方法生成新对象。

情况一：

String str1 = "hello";
String str2 = str1 + "world";

情况二：

String str1 = new String("hello");
String str2 = str1 + "world";

首先会在堆中创建一个"hello"，再把"hello"添加到常量池；然后会把"world"添加到常量池，拼接的时候，会在堆中创建一个"helloworld"。所以这两条语句总共创建了4个对象，堆中的"hello"、"helloworld"和常量池中的"hello"、"world"。

4. 变量和变量拼接:
变量和变量拼接，底层也会调用StringBuilder的append方法生成新对象。

情况一：

String str1 = "hello";
String str2 = "world";
String str3 = str1 + str2;

这段代码，首先会有一个"hello"在常量池中，然后有个"world"在常量池，第三行代码会调用append方法，在堆中生成一个"helloworld"。所以总共有3个对象。

情况二：

String str1 = "hello";
String str2 = new String("world");
String str3 = str1 + str2;

这段代码，首先在常量池中搞一个"hello"，然后在堆中new一个"world"，同时把"world"也搞到常量池中去，第三步拼接就会在堆中生成一个"helloworld"。所以总共有4个对象。

情况三：

String str1 = new String("hello");
String str2 = new String("world");
String str3 = str1 + str2;

第一行代码创建了两个对象，堆中一个常量池一个，第二行代码也是一样，第三行代码就在堆中创建了一个"helloworld"。所以总共创建了5个对象。

三、intern方法：

1、Java 1.7以前：

JDK 1.7以前，intern方法会把对象拷贝到常量池。看下面例子：

例一：

 String str1 = new String("str")+new String("01");
 str1.intern();
 String str2 = "str01";
 System.out.println(str2==str1);

图解上述代码：

image.png

首先new String("str")会在堆中创建str，同时添加到常量池；new String("01")也是一样的，在堆中创建01，同时添加到常量池；然后两者拼接，底层用的append方法，在堆中生成一个str01；然后str1.intern()，就把str01拷贝到常量池了；此时运行到String str2 = "str01"，发现常量池中有了，所以直接指向常量池中的str01。最终str1指向堆中的str01对象，str2指向常量池的str01对象，所以结果是false。

例二：

String str1 = new String("str")+new String("01");
 String str2 = "str01";
 str1.intern();
 System.out.println(str2==str1);

我们将第二三行代码调换顺序，看看情况有什么不同：

image.png

换一下顺序，区别就在于执行到第二行代码的时候，常量池中就已经有str01了，所以再执行str1.intern()的时候，就没有再进行拷贝了。最终还是str1指向堆中的str01，str2指向常量池的str01，所以结果还是false。

2、JDK1.7以后(包括1.7)：

从JDK 1.7开始，intern方法做了些改变，进行拷贝的时候不是拷贝对象，而是拷贝地址值。看下面的例子：

例一：

String str1 = new String("str")+new String("01");
str1.intern();
String str2 = "str01";
System.out.println(str2==str1);

图解上述代码：

image.png

第一步和JDK 1.7之前是一样的，现在堆中创建一个str，同时搞到常量池，再创建一个01，同时搞到常量池，然后拼接，在堆中生成对象str01；不同的就是str1.intern()，这次拷贝的不是str01这个对象，而是把它的地址值搞到常量池中去了；然后执行String str2 = str01的时候，去常量池找str01，发现常量池中有x001地址值，刚好该地址值对应的就是要找的str01，就直接拿过来用。最终就是str1指向地址值为x001的对象，str2也是指向地址值为x001的对象，所以结果是true。

例二：

String str1 = new String("str")+new String("01");
String str2 = "str01";
str1.intern();
System.out.println(str2==str1);

同样将二三行代码换一下位置，看看是什么情况：

image.png

第一步就不多说了，执行第二步时，往常量池中找str01，发现没有，那就添加一个；再执行str1.intern()时，发现常量池中有str01了，就不进行地址值的拷贝了。最终str1指向堆中的str01，str2指向常量池的str01，所以结果是false。

例三：

String str1 = new String("str")+new String("01");
String str2 = "str01";
str1 = str1.intern();
System.out.println(str2==str1);

就是把例二的str1.intern()改成str1 = str1.intern()，看看会有什么变化：

image.png

本来str1是指向堆中的str01的，然后重新将str1.intern()赋给str1，str1.intern()是指向常量池的，赋给str1后，所以此时str1也是指向常量池。所以结果就是true。

四、String、StringBuilder和StringBuffer：

String和后两者的区别就是String是不可变的，后两者可变。StringBuilder是JDK 1.5以后提供的，以前用StringBuffer。StringBuffer和StringBuilder的功能基本一样，只是StringBuffer是线程安全的，而StringBuilder不是线程安全的。
因此，StringBuilder的效率会更高。

上面字符串拼接部分的案例都是用加号拼接的，然后也提到了StringBuilder的append方法。其实就算是加号拼接，底层还是用的StringBuilder的append方法。看下面代码：

String s = "abc"; 
String ss = "ok" + s + "xyz" + 5;

这就用加号拼接的例子，利用反编译工具看看这段代码到底编译成了啥：

String s = "abc";
String ss = (new StringBuilder("ok")).append(s).append("xyz").append(5).toString();

可看到，编译后是用StringBuilder的append方法进行拼接的。那么使用加号和使用append方法到底有什么区别呢？看一下以下代码：

String s = ""; 
Random rand = new Random(); 
for (int i = 0; i < 10; i++){
     s = s + rand.nextInt(1000) + " "; 
} 
System.out.println(s);

这个例子很简单，就是在循环里面用加号进行字符串的拼接，看一下反编译后是什么样子的：

String s = ""; 
Random rand = new Random(); 
for(int i = 0; i < 10; i++) {
    s = (new StringBuilder(String.valueOf(s))).append(rand.nextInt(1000)).append(" ").toString(); 
}
System.out.println(s);

可以看到，它是在循环里面new了StringBuilder对象，然后用其append方法进行拼接。这里是i从0到9，也就是说要new十次，会创建十个对象，这样就会占用大量的资源。所以要让其编译后创建StringBuilder对象的过程在循环外面，代码就该这样写：

String s = ""; 
Random rand = new Random();
StringBuilder result = new StringBuilder();
for (int i = 0; i < 10; i++){ 
      result.append(rand.nextInt(1000)); 
      result.append(" ");
} 
System.out.println(result.toString());

那么编译后就是这样的：

String s = ""; 
Random rand = new Random(); 
StringBuilder result = new StringBuilder(); 
for(int i = 0; i < 10; i++) {
    result.append(rand.nextInt(1000)); 
    result.append(" "); 
}
System.out.println(result.toString());

这样就没有在循环里面new对象了。

小结：当要在循环里面进行字符串拼接的时候，就该先在循环外面new一个StringBuilder，然后在循环里面用append进行拼接；其他情况就可以使用加号进行拼接更加简单。

String问题

一、字符串的创建

二、字符串的拼接：

猜你喜欢

热点阅读