char[] 和 String 类型占用字节大小问题

在 C 语言中 一、char a[10] = {"China"} 中,这个 a 占用多少字节?bash

答:占用 10 个字节。

解析:上面代码对 a 作了赋值的操做,

a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='\0',a[6]='\0',a[7]='\0',a[8]='\0',a[9]='\0'

因此,它占用的是 10 个字节。
复制代码

二、若是单指 ”China“ ?微信

答:共 6 个字节。China 占 5 个字节,最后以 '\0' 结束,占 1 个字节。ide

在 Java 语言中
一、String s = "China"; 占多少字节?

答:占 5 个字节。
复制代码
System.out.println(Charset.defaultCharset());//获取ide默认编码类型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);
复制代码

以上代码,能够输出 "China" 所占的字节长度为 5学习

二、String s = "中国"; 占多少字节?编码

答:若是是 汉字 的状况须要考虑编码。spa

(1)GBK 编码(ide默认)时,每个汉字占用 2 个字节,那么中国占 4 个字节。.net

(2)UTF-8 编码时,每个汉字占用 3 个字节,那么中国占用 6 个字节。code

三、转码问题,GBK 转 UTF-8 时,字节占用会变大吗?反过来呢?blog

//获取的是 UTF-8编码
System.out.println(Charset.defaultCharset());
String s;
try {
        s = new String("中国".getBytes(),"GBK");
        byte[] b = s.getBytes();
        System.out.println("" + b.length);
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
}
复制代码

如上代码是:UTF-8 转 GBK 编码格式,s 长度从 6 字节变为 9 字节。 s 内容变化:中国 —> 涓浗 由于当前编码是 UTF-8,转码以后变成了 3 个文字,占用 9 个字节。然而,反过来的状况是这样的:utf-8

中国 (gbk) —> ?й? (utf-8) s 长度从 4字节 变成了 4字节,虽然长度没发生改变,可是文字已经改变。这里的 ? 占用 1 个字节。

给你们推荐一个优秀的iOS交流平台,平台里的伙伴们都是很是优秀的iOS开发人员,咱们专一于技术的分享与技巧的交流,你们能够在平台上讨论技术,交流学习。欢迎你们的加入(想要进入的可加微信)。 18174412518

转载原文连接:blog.csdn.net/smile_Runni…

相关文章
相关标签/搜索