一文带你看穿String
1.1 前言
String对象是不可变的。String类中每一个看起来会修改String值的方法,例如拼接、裁剪字符串,实际上都会创建一个全新的String对象,用来包含修改后的字符串内容。因此字符串的相关操作往往对性能有明显的影响。
1.2 定义
public final class String
implements java.io.Serializable, Comparable, CharSequence
从代码可以看出String是final类型的,表示该类不能被继承,并且实现了Serializable、Comparable、CharSequence三个接口。
Serializable接口,表明String类是可序列化的。
Comparable接口,提供了一个compareTo(T o) 方法。
CharSequence接口,提供了length(),charAt(int index),subSequence(int start,int end),toString()方法。
1.3 属性
//final类型的字符数组,用于存储字符串内容private final char value[];//存放字符串的哈希值private int hash; // Default to 0//序列化idprivate static final long serialVersionUID = -6849794470754667710L;
1.4 构造函数
//不含参数的构造函数public String() { this.value = "".value;}//使用字符串类型的参数来初始化public String(String original) { this.value = original.value; this.hash = original.hash;}//使用字符数组初始化public String(char value[]) { this.value = Arrays.copyOf(value, value.length);//将原有的字符数组中的内容逐一的复制到String中的字符数组中}//从位置offset复制count个字符public String(char value[], int offset, int count) { if (offset < 0) { throw new StringIndexOutOfBoundsException(offset); } if (count <= 0) { if (count < 0) { throw new StringIndexOutOfBoundsException(count); } if (offset <= value.length) { this.value = "".value; return; } } // Note: offset or count might be near -1>>>1. if (offset > value.length - count) { throw new StringIndexOutOfBoundsException(offset + count); } this.value = Arrays.copyOfRange(value, offset, offset+count);}//使用整型数组初始化public String(int[] codePoints, int offset, int count) { if (offset < 0) { throw new StringIndexOutOfBoundsException(offset); } if (count <= 0) { if (count < 0) { throw new StringIndexOutOfBoundsException(count); } if (offset <= codePoints.length) { this.value = "".value; return; } } // Note: offset or count might be near -1>>>1. if (offset > codePoints.length - count) { throw new StringIndexOutOfBoundsException(offset + count); } final int end = offset + count; // Pass 1: Compute precise size of char[] int n = count; for (int i = offset; i < end; i++) { int c = codePoints[i]; if (Character.isBmpCodePoint(c)) continue; else if (Character.isValidCodePoint(c)) n++; else throw new IllegalArgumentException(Integer.toString(c)); } // Pass 2: Allocate and fill in char[] final char[] v = new char[n]; for (int i = offset, j = 0; i < end; i++, j++) { int c = codePoints[i]; if (Character.isBmpCodePoint(c)) v[j] = (char)c; else Character.toSurrogates(c, v, j++); } this.value = v;}//检查字符数组是否越界private static void checkBounds(byte[] bytes, int offset, int length) { if (length < 0) throw new StringIndexOutOfBoundsException(length); if (offset < 0) throw new StringIndexOutOfBoundsException(offset); if (offset > bytes.length - length) throw new StringIndexOutOfBoundsException(offset + length);}//从bytes数组中的offset位置开始,将长度为length的字符,使用charsetName格式解码,初始化字符串public String(byte bytes[], int offset, int length, String charsetName) throws UnsupportedEncodingException { if (charsetName == null) throw new NullPointerException("charsetName"); checkBounds(bytes, offset, length); this.value = StringCoding.decode(charsetName, bytes, offset, length);}//从bytes数组中的offset位置开始,将长度为length的字符,使用charset解码,初始化字符串public String(byte bytes[], int offset, int length, Charset charset) { if (charset == null) throw new NullPointerException("charset"); checkBounds(bytes, offset, length); this.value = StringCoding.decode(charset, bytes, offset, length);}//通过charsetName来解码指定的byte数组,将其解码成unicode的char[]数组,够造成新的Stringpublic String(byte bytes[], String charsetName) throws UnsupportedEncodingException { this(bytes, 0, bytes.length, charsetName);}//通过charset来解码指定的byte数组,将其解码成unicode的char[]数组,够造成新的Stringpublic String(byte bytes[], Charset charset) { this(bytes, 0, bytes.length, charset);}//从bytes数组中的offset位置开始,将长度为length的字符,初始化字符串public String(byte bytes[], int offset, int length) { checkBounds(bytes, offset, length); this.value = StringCoding.decode(bytes, offset, length);}//使用字节数组来初始化public String(byte bytes[]) { this(bytes, 0, bytes.length);}//使用StringBuffer来构建字符串,不建议使用,可以使用StringBuffer.toString()来得到字符串public String(StringBuffer buffer) { synchronized(buffer) { this.value = Arrays.copyOf(buffer.getValue(), buffer.length()); }}//使用StringBuilder来构建字符串,不建议使用,可以使用StringBuilder.toString()来得到字符串public String(StringBuilder builder) { this.value = Arrays.copyOf(builder.getValue(), builder.length());}//保护类型的构造函数,其中参数share没有被使用,加入这个share的只是为了区分于String(char[] value)方法,
//String(char[] value)方法在创建String的时候会用到 会用到Arrays的copyOf方法将value中的内容逐一复制到String当中,而这个String(char[] value, boolean share)方法则是直接将value的引用赋值给String的value。那么也就是说,这个方法构造出来的String和参数传过来的char[] value共享同一个数组。
//优点:性能好,节约内存
//该方法之所以设置为protected,是因为一旦该方法设置为公有,那就破坏了字符串的不可变性String(char[] value, boolean share) { // assert share : "unshared not supported"; this.value = value;}
1.5 常用方法
1.5.1 length()
//返回字符串长度public int length() { return value.length;}
1.5.2 isEmpty()
//返回字符串是否为空public boolean isEmpty() { return value.length == 0;}
1.5.3 charAt(int index)
//返回字符串中第(index+1)个字符public char charAt(int index) { if ((index < 0) || (index >= value.length)) { throw new StringIndexOutOfBoundsException(index); } return value[index];}
1.5.4 startsWith(String prefix,int toffset)
//用于检测字符串是否以指定的前缀开始,其中toffset是字符串中开始查找的位置public boolean startsWith(String prefix, int toffset) { char ta[] = value; int to = toffset; char pa[] = prefix.value;//字串int po = 0; int pc = prefix.value.length;//字串长度// Note: toffset might be near -1>>>1. if ((toffset < 0) || (toffset > value.length - pc)) {//如果toffset为负或大于此String对象的长度,返回falsereturn false; } while (--pc >= 0) { if (ta[to++] != pa[po++]) {//依次比较return false; } } return true;}
1.5.5 endsWith(String suffix)
//此字符串是否以指定的后缀结束public boolean endsWith(String suffix) { return startsWith(suffix, value.length - suffix.value.length);}
1.5.6 index(int ch,int fromIndex)
//返回在此字符串中第一次出现指定字符处的索引,从指定的索引开始搜索,如果此字符串中没有这样的字符,则返回 -1public int indexOf(int ch, int fromIndex) { final int max = value.length; if (fromIndex < 0) { fromIndex = 0; } else if (fromIndex >= max) { // Note: fromIndex might be near -1>>>1. return -1; } if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) { // handle most cases here (ch is a BMP code point or a // negative value (invalid code point)) final char[] value = this.value; for (int i = fromIndex; i < max; i++) { if (value[i] == ch) { return i; } } return -1; } else { return indexOfSupplementary(ch, fromIndex); }}
1.5.7 substring(int beginIndex)
//返回一个新的字符串,它是此字符串的一个子字符串
//使用String(value, beginIndex, subLen)方法创建一个新的String并返回,这个方法会将原来的char[]中的值逐一复制到新的String中public String substring(int beginIndex) { if (beginIndex < 0) { throw new StringIndexOutOfBoundsException(beginIndex); } int subLen = value.length - beginIndex; if (subLen < 0) { throw new StringIndexOutOfBoundsException(subLen); } return (beginIndex == 0) ? this : new String(value, beginIndex, subLen);}
1.5.8 concat(String str)
//拼接字符串public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } int len = value.length; char buf[] = Arrays.copyOf(value, len + otherLen); str.getChars(buf, len); return new String(buf, true);}
concat(String str)方法首先获取拼接字符串的长度,判断这个字符串长度是否为0(判断这个用来拼接的字符串是不是空串),如果是就返回原来的字符串(等于没有拼接);否则就获取源字符串的长度,创建一个新的char[]字符数组,这个字符数组的长度是拼接字符串的长度与源字符串的长度之和,通过Arrays类的copyOf方法复制源数组,然后通过getChars方法将拼接字符串拼接到源字符串中,然后将新串返回。
1.5.9 replace(char oldChar,char newChar)
//将字符串中的oldChar 字符换成 newChar 字符public String replace(char oldChar, char newChar) { if (oldChar != newChar) { int len = value.length; int i = -1; char[] val = value; /* avoid getfield opcode */ while (++i < len) {//先找到旧值最开始出现的位置,减少对比的时间,有效提升效率if (val[i] == oldChar) { break; } }//从找到旧值那个位置开始,直到末尾,用新值代替出现的旧值if (i < len) { char buf[] = new char[len]; for (int j = 0; j < i; j++) { buf[j] = val[j]; } while (i < len) { char c = val[i]; buf[i] = (c == oldChar) ? newChar : c; i++; } return new String(buf, true); } } return this;}
1.5.10 contains(CharSequence s)
//判断字符串是否包含字符序列 spublic boolean contains(CharSequence s) { return indexOf(s.toString()) > -1;}
1.5.11 trim()
//去掉字符串两端空格public String trim() { int len = value.length; int st = 0; char[] val = value; /* avoid getfield opcode *///找到字符串前端没有空格的位置while ((st < len) && (val[st] <= ' ')) { st++; }//找到字符串末尾没有空格的位置while ((st < len) && (val[len - 1] <= ' ')) { len--; }//如果前后都没有出现空格,返回字符串本身return ((st > 0) || (len < value.length)) ? substring(st, len) : this;}
1.5.12 toCharArray()
//将字符串转化成字符数组public char[] toCharArray() { // Cannot use Arrays.copyOf because of class initialization order issues char result[] = new char[value.length]; System.arraycopy(value, 0, result, 0, value.length); return result;}
1.5.13 equals(Object anObject)
//比较对象public boolean equals(Object anObject) { if (this == anObject) {//判断当前对象与anObject是不是同一个对象,若是,直接返回truereturn true; } if (anObject instanceof String) {//anObject是不是String类型的,如果不是,直接返回falseString anotherString = (String)anObject; int n = value.length; if (n == anotherString.value.length) {//比较两个数组长度是否相等,若不相等,返回falsechar v1[] = value; char v2[] = anotherString.value; int i = 0; while (n-- != 0) {//循环逐一比较值,若都相等者返回trueif (v1[i] != v2[i]) return false; i++; } return true; } } return false;}
1.5.14 compareTo(String anotherString)
//比较字符串public int compareTo(String anotherString) { int len1 = value.length; int len2 = anotherString.value.length; int lim = Math.min(len1, len2);//取两个字符串的长度的最小值char v1[] = value; char v2[] = anotherString.value; int k = 0; while (k < lim) { char c1 = v1[k]; char c2 = v2[k]; if (c1 != c2) { return c1 - c2; } k++; } return len1 - len2;}
判断两个字符串的长度是否相等。
若相等,再继续判断每个字符是否相同,若相同则返回0,不相同,则返回第一个不同字符的ascii码的差值。
若不相等,则判断短的字符串是否是长串的字串,若是,则返回长度的差值,若不是,则返回第一个不同字符的ascii码的差值。
1.6 方法总结
方法名说明
length() 返回字符串长度
isEmpty()返回字符串是否为空
charAt(int index)返回字符串中第(index+1)个字符
char[] toCharArray()转化成字符数组
trim()去掉字符串两端空格
toUpperCase()转化为大写
toLowerCase()转化为小写
concat(String str)拼接字符串
replace(char oldChar, char newChar)将字符串中的
oldChar 字符换成 newChar 字符
boolean matches(String regex)判断字符串是否匹配给定的regex正则表达式
boolean contains(CharSequence s)判断字符串是否包含字符序列 s
String[] split(String regex, int limit)按照字符 regex将字符串分成 limit 份
String[] split(String regex)按照字符 regex 将字符串分段
equals(Object anObject)比较对象
equalsIgnoreCase(String anotherString)忽略大小写比较字符串对象
startsWith(String prefix,int toffset)字符串从指定索引开始的子字符串是否以指定前缀开始
endsWith(String suffix)此字符串是否以指定的后缀结束
1.7 String的一些注意点
String 对 “+” 的支持其实就是使用了 StringBuilder 以及他的 append、toString 两个方法。
字符串的 switch 是通过 equals() 和 hashCode() 方法来实现的。记住,switch 中只能使用整型,比如 byte,short,char(ackii码是整型) 以及 int。
1.8 String经典的面试题
String s1="abc"; String s2="abc"; System.out.println(s1==s2); System.out.println(s1.equals(s2));/*output:
true true
*/
该题主要考察对于java常量池的理解,先在常量池中创建”abc“,并指向s1,而后在创建s2时,由于常量池中已经存在”abc“,只需指向s2就可以,而不需要再创建。”==”在这里比较的是对象引用,故结果为”true”,String 中的equals方法经过重写后操作为比较此字符串与指定的对象的值是否相等,因此是true。
Strings1=newString("abc");Strings2="abc";System.out.println(s1==s2); System.out.println(s1.equals(s2));/*output:
false
true
*/
s1是通过new创建的对象在堆内存,s2在方法区中的常量池中,因此地址不一样,==是false。
String s1="a"+"b"+"c";String s2="abc";System.out.println(s1==s2);System.out.println(s1.equals(s2));/*output:
true
true
*/
编译时s1已经成为“abc”在常量池中查找创建,s2不需要再创建。
Strings1="ab";Strings2="abc";Strings3=s1+"c";System.out.println(s3==s2);System.out.println(s3.equals(s2));/*output:
false
true
*/
先在常量池中创建”ab“,地址指向s1,再创建”abc”,指向s2。对于s3,先创建StringBuilder(或 StringBuffer)对象,通过append连接得到“abc”,再调用toString()转换得到的地址指向s3。故(s3==s2)为false。
1.9总结
一旦 String 对象在内存(堆)中被创建出来,就无法被修改。
如果你需要一个可修改的字符串,应该使用 StringBuffer 或者
StringBuilder。
如果你只需要创建一个字符串,你可以使用双引号的方式,如果你需要在堆中创建一个新的对象,你可以选择构造函数的方式。