WCHAR我再也不害怕了

转自http://www.cppblog.com/shongbee2/archive/2009/04/28/81349.html

补充:WideCharToMultiByte转换为char*以后,是GB2312编码的。补充两个GB2312和UTF-8的转换函数。html

//UTF-8到GB2312的转换
char* U2G(const char* utf8)
{
	int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);
	wchar_t* wstr = new wchar_t[len+1];
	memset(wstr, 0, len+1);
	MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);
	len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL, NULL);
	char* str = new char[len+1];
	memset(str, 0, len+1);
	WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);
	if(wstr)
	{
		delete[] wstr;
	}
	return str;
}

//GB2312到UTF-8的转换
char* G2U(const char* gb2312)
{
	int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0);
	wchar_t* wstr = new wchar_t[len+1];
	memset(wstr, 0, len+1);
	MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);
	len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL, NULL);
	char* str = new char[len+1];
	memset(str, 0, len+1);
	WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);
	if(wstr)
	{
		delete[] wstr;
	}
	return str;
}


WCHAR我再也不害怕了

宽字符已经困扰我好久了,之前我都是设置项目的属性把它改成多字节,不用UNICODE。不过如今又遇到宽字节的问题,没有办法,只有硬着头皮学学:
我找到的资料:
http://hi.baidu.com/shongbee2/blog/item/207925546b6cdd5fd10906e0.html
http://hi.baidu.com/shongbee2/blog/item/d4a057511e9539878c5430cb.html
看了以后我才发现原来有wcsXXX的函数专门处理宽字节的,就是strXXX同样好使。呵呵,我再也不害怕了,就试着本身写了一下,仍是学了蛮多东西的:
1.有wcsXXX的函数和strXXX的函数对应处理宽字节,wcslen就是求长度的,wcscmp就是比较两个字符串的。
2.输出也有相关的操做,wprintf(L”%s%s”);这样的操做,对文件也能够用fwprintf函数来输出。不过我发现貌似cout << wchar;不成功。也发现了一个问题,就是我输出”相等”这样一个字符串的时候,发现竟然输出不正确,不管是控制台和文件都有错误。可见,这个仍是有点小问题的。输出其余的例如”12345”等都是正常的。哎,这个函数并不可靠啊。
3.宽字节和普通串的转换问题,学了两个函数,一个是:
wcstombs(char* strDes, const wchar*, size_t nMax);这个函数的做用是把wchar转换为char。
char* strDes 为保存转换后的普通字符串,wchar* 要被转换的宽字符串。转换的最大长度。这里的长度是转换的个数,而不是字节长度。
mbstowcs() 就是一个相反的过程了,参数就不说了。

另外一套转换的函数是:
int WideCharToMultiByte(
  UINT CodePage,
  DWORD dwFlags,
  LPCWSTR lpWideCharStr,
  int cchWideChar,
  LPSTR lpMultiByteStr,
  int cbMultiByte,
  LPCSTR lpDefaultChar,    
  LPBOOL lpUsedDefaultChar
);
他的参数不少,上面的链接有介绍,这里就不怎么细说了。
第一个是编码的方式,我通常用CP_ACP。第二个是转换标志,MSDN上说什么都不设置更快,而后我就什么都无论了就用NULL了。具体做用不知道,等遇到了再学。第三个参数就是被转换的字符串,第四个参数是该字符串的长度,-1表示自动算长度,若是是手动给出,必定要把最后的终结符长度也算上。我以为仍是-1来的实际。第五个参数就是保存转换串的指针,第六个参数就是保存串的长度,这里是单位字符的个数。若是转换的时候没有终结符,那么结果也没有终结符,要注意下。最后两个参数就是默认的填充字符和是否使用了默认填充字符,我通常就用NULL代替。

普通串转宽字节也是相似。
这里有几个注意的,必定要保证空间足够。还有就是那个长度是单位字符个数,而不是字节数,在转换时,推荐被转换的字符串长度设置为-1,由于这样他会自动算出终结符结束。返回值也是转换的单位字符个数。例如”相等”有普通串转换为宽字节串,返回结果是3,(有终结符),而反过来就是5。若是返回时0 说明转换失败。

心得:虽然WideCharToMultiByte的参数要多,感受用的没有wcstombs爽,但是他的准确好高一些,要转换的话,还用用WideCharToMultiByte比较合适,还有就是虽然有一套wcsXXX的库函数,惋惜输出仍是出现问题的。若是全都用宽字节,那没有关系wcsxxx的函数仍是蛮好用的。还有一个疑惑我明明查字典multi是多的意思也就是说multibyte是多字节,个人中文版VS2005配置里面也是说的多字节。搞不懂为何要用宽字节呢?多是多字节编码很差用吧。呵呵。 废话也说完了,奉上源代码:
#include  < iostream >
#include 
< fstream >
#include 
< windows.h >
using   namespace  std;

int  main()
{
    FILE
*  fp ;
    WCHAR wchar[
5 =  L " 相等相等 " ;         // 定义一个宽字节的变量,初始为"相等"
    fp  =  fopen( " 1.txt " " w+ " );         // 打开文件称奥作
    fwprintf(fp, L " %s\n " , wchar);     // 输出到文件
    fclose(fp);                         // 关闭文件
    WCHAR wc2[ 5 ];                     // 定义第二个宽字节变量
    
    
// wc开始的有不少宽字节的操做。都和str相对应。
    wcscpy(wc2, wchar);                 // 复制。
     int  n  =  wcscmp(wc2, wchar);         // 比较
     if  (n  ==   0 )
    {
        wprintf(L
" 相等\n " );             // 这里是否注意到没有wprintf有问题的。
    }

    
char  str[ 10 ];                     // 定义char字符。
    n  =  wcstombs(str, wc2,  9 );         // 宽字节转换为muiltychar
    printf( " %s\n " , str);             // 输出结果

    
for  ( int  i  =   0 ; i  <   5 ++ i)
    {
        wc2[i] 
=  L ' 1 '   +  i;
    }
    wc2[
4 =   0 ;

    n 
=  wcstombs(str, wc2,  9 );         // 宽字节转换为muiltychar
    printf( " %s\n " , str);             // 输出结果
    
// 另外的方式转换
    n  =  WideCharToMultiByte(CP_ACP, NULL, wchar, wcslen(wchar)  +   1 , str,  10 0 0 );
    printf(
" %s\n " , str);
    
char  str2[ 10 =   " 加一 " ;
    WCHAR wc3[
10 ];
    n 
=  MultiByteToWideChar(CP_ACP, NULL, str2, strlen(str2)  +   1 , wc3,  10 );     // char到宽字节。

    system(
" pause " );
    
return   0 ; }