昨天还在 for 循环里写加号拼接字符串的那个同事,今天已经不在了

引言java

都说 StringBuilder 在处理字符串拼接上效率要强于 String,但有时候咱们的理解可能会存在必定的误差。最近我在测试数据导入效率的时候就发现我之前对 StringBuilder 的部分理解是错误的。后来我经过实践测试 + 找原理 的方式搞清楚了这块的逻辑。如今将过程分享给你们微信

测试用例app

咱们的代码在循环中拼接字符串通常有两种状况机器学习

  • 第一种就是每次循环将对象中的几个字段拼接成一个新字段,再赋值给对象
  • 第二种操做是在循环外建立一个字符串对象,每次循环向该字符串拼接新的内容。循环结束后获得拼接好的字符串

对于这两种状况,我建立了两个对照组ide

第一组:学习

在每次 For 循环中拼接字符串,即拼即用、用完即毁。分别使用 String 和 StringBuilder 拼接测试

/**
     * 循环内 String 拼接字符串,一次循环后销毁
     */
    public static void useString(){
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            String str = str1 + i + str2 + i + str3 + i + str4 ;
        }
    }

    /**
     * 循环内 使用 StringBuilder 拼接字符串,一次循环后销毁
     */
    public static void useStringBuilder(){
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            StringBuilder sb = new StringBuilder();
            String s = sb.append(str1).append(i).append(str2).append(i).append(str3).append(i).append(str4).toString();
        }
    }

第二组:大数据

屡次 For 循环拼接一个字符串,循环结束后使用字符串,使用后由垃圾回收器回收。也是分别使用 String 和 StringBuilder 拼接优化

/**
     * 屡次循环拼接成一个字符串 用 String
     */
    public static void useStringSpliceOneStr (){
        String str = "";
        for (int i = 0; i < CYCLE_NUM_LOWER; i++) {
            str += str1 + str2 + str3 + str4 + i;
        }
    }

    /**
     * 屡次循环拼接成一个字符串 用 StringBuilder
     */
    public static void useStringBuilderSpliceOneStr(){
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < CYCLE_NUM_LOWER; i++) {
            sb.append(str1).append(str2).append(str3).append(str4).append(i);
        }
    }

为了保证测试质量,在每一个测试项目进行前。线程休息 2s,以后空跑 5 次热身。最后执行 5 次求平均时间的方式计算时间ui

public static int executeSometime(int kind, int num) throws InterruptedException {
        Thread.sleep(2000);
        int sum = 0;
        for (int i = 0; i < num + 5; i++) {
            long begin = System.currentTimeMillis();

            switch (kind){
                case 1:
                    useString();
                    break;
                case 2:
                    useStringBuilder();
                    break;
                case 3:
                    useStringSpliceOneStr();
                    break;
                case 4:
                    useStringBuilderSpliceOneStr();
                    break;
                default:
                    return 0;
            }

            long end = System.currentTimeMillis();

            if(i > 5){
                sum += (end - begin);
            }
        }
        return sum / num;
    }

主方法

public class StringTest {
    public static final int CYCLE_NUM_BIGGER = 10_000_000;
    public static final int CYCLE_NUM_LOWER = 10_000;
    public static final String str1 = "张三";
    public static final String str2 = "李四";
    public static final String str3 = "王五";
    public static final String str4 = "赵六";


    public static void main(String[] args) throws InterruptedException {
        int time = 0;
        int num = 5;

        time = executeSometime(1, num);
        System.out.println("String拼接 "+ CYCLE_NUM_BIGGER +" 次," + num + "次平均时间:" + time + " ms");

        time = executeSometime(2, num);
        System.out.println("StringBuilder拼接 "+ CYCLE_NUM_BIGGER +" 次," + num + "次平均时间:" + time + " ms");

        time = executeSometime(3, num);
        System.out.println("String拼接单个字符串 "+ CYCLE_NUM_LOWER +" 次," + num + "次平均时间:" + time + " ms");

        time = executeSometime(4, num);
        System.out.println("StringBuilder拼接单个字符串 "+ CYCLE_NUM_LOWER +" 次," + num + "次平均时间:" + time + " ms");

    }
}

测试结果

测试结果以下: 在这里插入图片描述 结果分析

第一组 10_000_000 次循环拼接,在循环内使用 String 和 StringBuilder 的效率是同样的!为何呢?

使用 javap -c StringTest.class 反编译查看两个方法编译后的文件: 在这里插入图片描述 能够发现 String 方法拼接字符串编译器优化后使用的就是 StringBuilder、所以用例1 和用例2 的效率是同样的。

第二组 第二组的结果就是你们喜闻乐见的了,因为 10_000_000 次循环String 拼接实在太慢因此我采用了 10_000 次拼接来分析。

分析用例3:虽然编译器会对 String 拼接作优化,可是它每次在循环内建立 StringBuilder 对象,在循环内销毁。下次循环他有建立。相比较用例4在循环外建立,多了 n 次 new 对象、销毁对象的操做、n - 1 次将 StringBuilder 转换成 String 的操做 。效率低也是理所应当了。

扩展 第一组的测试还有一种写法:

/**
     * 循环内 使用 StringBuilder 拼接字符串,一次循环后销毁
     */
    public static void useStringBuilderOut(){
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
//            sb.setLength(0);
            sb.delete(0, sb.length());
            String s = sb.append(str1).append(i).append(str2).append(i).append(str3).append(i).append(str4).toString();
        }
    }

循环外建立 StringBuilder 每次循环开始的时候清空 StringBuilder 的内容而后拼接。这种写法不管使用 sb.setLength(0); 仍是 sb.delete(0, sb.length()); 效率都比直接在循环内使用 String / StringBuilder 慢。奈何才疏学浅我一直想不明白为何他慢。我猜想是 new 对象的速度比重置长度慢,因而这样测试了如下:

public static void createStringBuider() {
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            StringBuilder sb = new StringBuilder();
        }
    }

    public static void cleanStringBuider() {
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < CYCLE_NUM_BIGGER; i++) {
            sb.delete(0, sb.length());
        }
    }

可是结果是 cleanStringBuider 更快。让我摸不着头脑

若是有大神看到但愿能够帮忙分析分析

结论

  • 编译器会将 String 拼接优化成使用 StringBuilder,可是仍是有一些缺陷的。主要体如今循环内使用字符串拼接,编译器不会建立单个 StringBuilder 以复用
  • 对于屡次循环内拼接一个字符串的需求:StringBuilder 很快,由于其避免了 n 次 new 对象、销毁对象的操做,n - 1 次将 StringBuilder 转换成 String 的操做
  • StringBuilder 拼接不适用于循环内每次拼接即用的操做方式。由于编译器优化后的 String 拼接也是使用 StringBuilder 二者的效率同样。后者写起来还方便... 在这里插入图片描述

欢迎关注个人微信公众号「码农突围」,分享Python、Java、大数据、机器学习、人工智能等技术,关注码农技术提高•职场突围•思惟跃迁,20万+码农成长充电第一站,陪有梦想的你一块儿成长