为了支持多语言,须要支持宽字符,Linux下用wchar_t表示,wchar_t最大长度4个字节,已经能够囊括世界上全部的语言编码,中文字符在gb2312编码下用2个字节表示,但用utf-8编码须要3个字节表示。函数
Linux下的系统调用,大部分都已经有对应的宽字符版本。具体可参照对照表测试
但仍有一些系统调用是没有宽字符版本的,例如fopen系列函数:编码
FILE *fopen(const char *path, const char *mode);.net
首先要设置本地区域blog
setlocale(LC_CTYPE, "zh_CN.utf8");
1
而后进行转换utf-8
/**
* 用malloc申请了空间,须要在外面释放
*/
int to_wchar(wchar_t **ppDest, const char *pSrc)
{
int len = 0;
int ret = 0;字符串
len = strlen(pSrc) + 1;get
if (len <= 1) return 0;string
*ppDest = malloc (len);io
/*这里的len应该为宽字符长度,而非源字符串的字节长度,但字节长度确定大于宽字符长度,所以暂且用之*/
ret = mbstowcs(*ppDest, pSrc, len);
return ret;
}
/**
* 用malloc申请了空间,须要在外面释放
*/
int wtochar(char **ppDest, const wchar_t *pSrc)
{
int len = 0;
int ret = 0;
len = wcslen(pSrc) + 1;
if (len <= 1) return 0;
/*sizeof(wchar_t) = 4 */
*ppDest = malloc (len * sizeof(wchar_t));
/*这里的第三个长度参数,应为字节长度,即宽字符长度 * 4 */
ret = wcstombs(*ppDest, pSrc, len * sizeof(wchar_t));
return ret;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
测试程序:
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include <wchar.h>
#include <locale.h>
#define array_size(ar) (sizeof(ar) / sizeof(ar[0]))
wchar_t *to_wchar(wchar_t **ppDest, const char *pSrc)
{
int len = 0;
int ret = 0;
len = strlen(pSrc) + 1;
if (len <= 1) return *ppDest;
*ppDest = (wchar_t*)malloc (len*sizeof(wchar_t));
/*若是第一个参数为NULL,则能够用来返回宽字符的长度*/
printf ("len:%ld\n", mbstowcs(NULL,pSrc,0)+1);
ret = mbstowcs(*ppDest, pSrc, len);
return *ppDest;
}
int main()
{
char *a = "一";
wchar_t *b = L"1s一";
wchar_t *c = L"1s一";
wchar_t *pbuf;
wchar_t wbuf[100];
setlocale(LC_CTYPE, "zh_CN.utf8");
printf ("len:%ld\n", strlen(a));
printf ("wlen:%ld\n", wcslen(b));
to_wchar(&pbuf, "1s壹");
free(pbuf);
printf ("wbuf sieof:%ld\n", sizeof(wbuf));
printf ("wbuf array sizeof:%ld\n", array_size(wbuf));
return 0;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
输出结果:
[root@23 test]# ./test_hanzi len:3 wlen:3 len:4 wbuf sieof:400 // sizeof (宽字符) = 所占字节的总长度 = 宽字符长度 * 4 wbuf array sizeof:100 --------------------- 做者:wwlhz 来源:CSDN 原文:https://blog.csdn.net/wwlhz/article/details/74775053 版权声明:本文为博主原创文章,转载请附上博文连接!