java中的char类型

一:char的初始化java

char是Java中的保留字,与别的语言不一样的是,char在Java中是16位的,由于Java用的是Unicode。不过8位的ASCII码包含在Unicode中,是从0~127的。数组

Java中使用Unicode的缘由是,Java的Applet容许全世界范围内运行,那它就须要一种能够表述人类全部语言的字符编码。 Unicode。可是English,Spanish,German, French根本不须要这么表示,因此它们其实采用ASCII码会更高效。这中间就存在一个权衡问题。编码

由于char是16位的,采起的Unicode的编码方式,因此char就有如下的初始化方式:spa

char c='c'; //字符,能够是汉字,由于是Unicode编码code

char c=十进制数,八进制数,十六进制数等等; //能够用整数赋值utf-8

char c='\u数字'; //用字符的编码值来初始化,如:char='\0',表示结束符,它的ascll码是0,这句话的意思和 char c=0 是一个意思。unicode

 

 

二:关于char占几个字节的问题以下:get

1:“字节”是byte,“位”是bit ;it

  2: 1 byte = 8 bit ;io

  char 在java中是2个字节。java采用unicode,2个字节(16位)来表示一个字符。

  例子代码以下:

[java] 代码

  1. public class Test {  

  2.   

  3.   

  4.     public static void main(String[] args) {  

  5.         String str= "中";  

  6.         char x ='中';  

  7.         byte[] bytes=null;  

  8.         byte[] bytes1=null;  

  9.         try {  

  10.             bytes = str.getBytes("utf-8");  

  11.             bytes1 = charToByte(x);  

  12.         } catch (UnsupportedEncodingException e) {  

  13.             // TODO Auto-generated catch block  

  14.             e.printStackTrace();  

  15.         }  

  16.         System.out.println("bytes 大小:"+bytes.length);  

  17.         System.out.println("bytes1大小:"+bytes1.length);  

  18.     }  

  19.     public static byte[] charToByte(char c) {   

  20.         byte[] b = new byte[2];   

  21.         b[0] = (byte) ((c & 0xFF00) >> 8);   

  22.         b[1] = (byte) (c & 0xFF);   

  23.         return b;   

  24.     }  

  25. }  

运行结果:

bytes 大小:3
bytes1大小:2


java是用unicode来表示字符,"中"这个中文字符的unicode就是2个字节。

 String.getBytes(encoding)方法是获取指定编码的byte数组表示,

一般gbk/gb2312是2个字节,utf-8是3个字节

若是不指定encoding则取系统默认的encoding。

相关文章
相关标签/搜索