Java-字符串-String

时间 2019-12-01

标签 java 字符串 string 栏目 Java 繁體版

原文原文链接

String

Java程序中全部的字符串文字（例如"abc" ）均可以被看做是实现此类的实例。html

特色：java

一、字符串String类型自己是final声明的，意味着咱们不能继承String。jquery

二、字符串的对象也是不可变对象，意味着一旦进行修改，就会产生新对象正则表达式

　　咱们修改了字符串后，若是想要得到新的内容，必须从新接受。算法

三、String对象内部是用字符数组进行保存的api

　　JDK1.9以前有一个char[] value数组，JDK1.9以后byte[]数组数组

四、String类中这个char[] values数组也是final修饰的，意味着这个数组不可变，而后它是private修饰，外部不能直接操做它，String类型提供的全部的方法都是用新对象来表示修安全

改后内容的，因此保证了String对象的不可变。app

五、就由于字符串对象设计为不可变，那么因此字符串有常量池来保存不少常量对象，能够共享ui

　　若是涉及到大量的字符串修改操做，建议使用StringBuffer或StringBuilder

String对象的建立

一、字面常量值

　　String str = "hello";

二、使用构造器

public String() ：初始化新建立的 String对象，以使其表示空字符序列。
String(String original)：初始化一个新建立的 String 对象，使其表示一个与参数相同的字符序列；换句话说，新建立的字符串是该参数字符串的副本。
public String(char[] value) ：经过当前参数中的字符数组来构造新的String。
public String(char[] value,int offset, int count) ：经过字符数组的一部分来构造新的String。
public String(byte[] bytes) ：经过使用平台的默认字符集解码当前参数中的字节数组来构造新的String。
public String(byte[] bytes,String charsetName) ：经过使用指定的字符集解码当前参数中的字节数组来构造新的String。

三、静态方法

static String copyValueOf(char[] data)：返回指定数组中表示该字符序列的 String
static String copyValueOf(char[] data, int offset, int count)：返回指定数组中表示该字符序列的 String
static String valueOf(char[] data) ：返回指定数组中表示该字符序列的 String
static String valueOf(char[] data, int offset, int count) ：返回指定数组中表示该字符序列的 String
static String valueOf(xx value)：xx支持各类数据类型，返回各类数据类型的value参数的字符串表示形式。

四、xx.toString()　

　　StringBuffer s = new StringBuffer(xx);
　　String str = s.toString();　　：返回字符串对象

五、和字符串的拼接+

　　任意数据类型与"字符串"进行拼接，结果都是字符串

String对象的个数

String str = "hello";　　//1个

String str = new String("atguigu");　　//2个

String s1 = "hello";//1个
String s2 = "world";//1个

String s3 = s1 + s2 + "java";　　//"java"1个，s1 + s2拼接结果1个，最后结果1个

字符串对象的内存分析

String对象的拼接

一、+

（1）常量+常量：结果是常量池

（2）常量与变量或变量与变量：结果是堆

　　指向堆中的字符串常量 + 常量：结果都在堆

（3）拼接后调用intern方法：结果在常量池

二、concat：拼接的结果都是新的字符串，哪怕是两个常量对象拼接，都在堆中

String s1 = "hello";
String s2 = "world";

String s3 = s1 + "world";　　//s3字符串内容也是helloworld，s1是变量，"world"常量，变量 + 常量的结果在堆中
String s4 = s1 + s2;　　　　//s4字符串内容也是helloworld，s1和s2都是变量，变量 + 变量的结果在堆中

String对象的比较

一、==：比较地址

二、equals(xx)：比较字符串内容，严格区分大小写。由于String类型重写equals

三、equalsIgnoreCase(xx)：比较字符串内容，不区分大小写

四、compareTo(xx)：比较字符串的大小，按照字符编码值比较，严格区分大小写。String类型重写了Comparable接口的抽象方法，天然排序

五、compareToIgnoreCase(xx)：比较字符串的大小，按照字符编码值比较，不区分大小写

六、java.text.Collator：文本校对器比较大小，按照指定语言环境的天然语言顺序比较大小（字典排序）

空字符的比较

空字符串

　　String str1 = "";
　　String str2 = new String();
　　String str3 = new String("");

判断某个字符串是不是空字符串

　　if("".equals(str))　　//推荐

　　if(str!=null && str.isEmpty())

　　if(str!=null && str.equals(""))

　　if(str!=null && str.length()==0)

String类的经常使用API

序号	方法签名	方法功能简介
1	String()	建立空字符串
2	String(String original)	根据original建立一个新字符串
3	static String valueOf(xx value)	根据value内容建立一个字符串
4	String intern()	将字符串的内容存入常量池
5	String concat()	字符串拼接
6	boolean equals(Object obj)	判断当前字符串与指定字符串内容是否已在，严格区分大小写
7	boolean equalsIgnoreCase(String obj)	判断当前字符串与指定字符串内容是否已在，不区分大小写
8	int compareTo(String str)	比较当前字符串与指定字符串的大小，严格区分大小写
9	int compareToIgnoreCase(String str)	比较当前字符串与指定字符串的大小，不区分大小写
10	boolean isEmpty()	判断当前字符串是否为空
11	int length()	返回当前字符串的长度
12	String toLowerCase()	将当前字符串转为小写
13	String toUpperCase()	将当前字符串转为大写
14	String trim()	去掉当前字符串先后空白符
15	boolean contains(xx)	判断当前字符串中是否包含xx
16	int indexOf(xx)	在当前字符串中查找xx第一次出现的下标
17	int lastIndexOf(xx)	在当前字符串中查找xx最后一次出现的下标
18	String substring(int beginIndex)	从当前字符串的[beginIndex, 最后]截取一个子串
19	String substring(int beginIndex, int endIndex)	从当前字符串的[beginIndex, endIndex)截取一个子串
20	char charAt(index)	返回当前字符串[index]位置字符
21	char[] toCharArray()	将当前字符串的内容用一个字符数组返回
22	String(char[] value)	用value字符数组的元素构建一个新字符串
23	String(char[] value,int offset, int count)	用value字符数组的[offset]开始的count个字符构建一个新字符串
24	static String copyValueOf(char[] data)	用data字符数组的元素构建一个新字符串
25	static String copyValueOf(char[] data, int offset, int count)	用data字符数组的[offset]开始的count个字符构建一个新字符串
26	static String valueOf(char[] data)	用data字符数组的元素构建一个新字符串
27	static String valueOf(char[] data, int offset, int count)	用data字符数组的[offset]开始的count个字符构建一个新字符串
28	byte[] getBytes()	将当前字符串按照平台默认字符编码方式编码为字节序列
29	byte[] getBytes(字符编码方式)	将当前字符串按照指定字符编码方式编码为字节序列
30	String(byte[] bytes)	将bytes字节序列按照平台默认字符编码方式解码为字符串
31	String(byte[] bytes,String charsetName)	将bytes字节序列按照指定字符编码方式解码为字符串
32	boolean startsWith(xx)	判断当前字符串是否以xx开头
33	boolean endsWith(xx)	判断当前字符串是否以xx结尾
34	boolean matchs(xx)	判断当前字符串是否知足xx正则
35	String replace(xx,yy)	将当前字符串中全部xx替换为yy
36	String replaceFirst(xx，value)	将当前字符串中第一个知足xx正则的字符替换为value
37	String repalceAll(xx， value)	将当前字符串中全部知足xx正则的字符替换为value
38	String[] split(xx)	将当前字符串按照xx正则拆分为多个字符串
39	void getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin)	将当前字符串的[srtBegin,srcEnd)部分字符复制到dst字符数组中，dst数组从[dstBegin]开始存储

StringBuffer和StringBuilder

String类的对象是不可变字符序列，StringBuffer和StringBuilder的对象是可变字符序列。

StringBuffer：老点，线程安全的，由于它的方法有synchronized修饰

StringBuilder：JDK1.5以后引入的，线程不安全，单线程状况下推荐使用。

经常使用的API，StringBuilder、StringBuffer的API是彻底一致的

StringBuilder、StringBuffer的API

序号	方法签名	方法区功能简介
1	StringBuffer()	建立一个空的可变字符序列，默认长度16
2	StringBuffer(String str)	用字符串str内容建立一个可变字符序列
3	StringBuffer append(数据类型 b)	在当前字符序列后面追加b
4	StringBufferinsert(int index, 数据类型 s)	在当前字符序列[index]插入s
5	StringBuffer delete(int start, int end)	删除当前字符序列[start,end)部分字符
6	StringBuffer deleteCharAt(int index)	删除当前字符序列[index]位置字符
7	void setLength(int newLength)	修改当前字符序列的长度为newLength
8	void setCharAt(int index, char ch)	替换当前字符序列[index]位置字符为ch
9	StringBuffer reverse()	将当前字符序列内容反转
10	StringBuffer replace(int start, int end, String str)	替换当前字符序列[start,end)部分字符为str
11	int indexOf(String str)	在当前字符序列中开始查找str第一次出现的下标
12	int indexOf(String str, int fromIndex)	在当前字符序列[fromIndex]开始查找str第一次出现的下标
13	int lastIndexOf(String str)	在当前字符序列中开始查找str最后一次出现的下标
14	int lastIndexOf(String str, int fromIndex)	在当前字符序列[fromIndex]开始查找str最后一次出现的下标
15	String substring(int start)	截取当前字符序列[start,最后]部分构成一个字符串
16	String substring(int start, int end)	截取当前字符序列[start,end)部分构成一个字符串
17	String toString()	将当前可变字符序列的内容用String字符串形式表示
18	void trimToSize()	若是缓冲区大于保存当前字符序列所需的存储空间，则将从新调整其大小，以便更好地利用存储空间。
19	int length()	返回当前字符序列的长度
20	char charAt(int index)	返回当前字符序列[index]位置字符
21	void getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin)	将当前字符串的[srtBegin,srcEnd)部分字符复制到dst字符数组中，dst数组从[dstBegin]开始存储

正则表达式

字符编码

ASCII码

0～31及127(共33个)是控制字符或通讯专用字符（其他为可显示字符），如控制符：LF（换行）、CR（回车）、FF（换页）、DEL（删除）、BS（退格)
32～126(共95个)是字符(32是空格），其中48～57为0到9十个阿拉伯数字。
65～90为26个大写英文字母，97～122号为26个小写英文字母，其他为一些标点符号、运算符号等。

Unicode

为解决一个问题：若是一份文档中含有不一样国家的不一样语言的字符，那么没法在一份文档中显示全部字符。Unicode字符集涵盖了目前人类使用的全部字符，并为每一个字符进行统一编号，分配惟一的字符码（Code Point）

UTF-8

它是一种变长的编码方式。它可使用1~4个字节表示一个符号。从unicode到uft-8并非直接的对应，而是要过一些算法和规则来转换（即Uncidoe字符集≠UTF-8编码方式）

Unicode只是定义了一个庞大的、全球通用的字符集，并为每一个字符规定了惟一肯定的编号，具体存储成什么样的字节流，取决于字符编码方案。推荐的Unicode编码是UTF-16

和UTF-8。