C语言字符串处理

1、java

C语言中,为何字符串能够赋值给字符指针变量c++

char *p,a='5';
p=&a;                     //显然是正确的,
p="abcd";              //但为何也能够这样赋值??

问:一直理解不了为何能够将字串常量赋值给字符指针变量,请各位指点!
 
答:
双引号作了3件事:  
1.申请了空间(在常量区),存放了字符串 
2. 在字符串尾加上了'/0'    
3.返回地址

你这里就是 返回的地址  赋值给了  p                      


2、

char *p = “hello”;数组

上边的表达式为何能够,而把p换成数组,而后再赋值就不行了函数

解释:测试

字符串常量"hello"出如今一个表达式中时,"hello"表达式使用的值就是这些字符所存储的地址(在常量区),而不是这些字符自己。this

因此,能够把字符串赋值给指向字符的指针p,而不能把字符串赋值给一个字符数组。 spa

char a[10] = “hello”; //这样能够,这种状况是c语言初始化所支持的.net

若是写成char a[10]指针

而后 a = “hello” 这样就错误了。  对象

一样是a数组,char a[10] = “hello”;这种是数组的初始化,和a[0] = ‘h’ a[1] = ‘e’…是一个道理

可是换成char a [10]

而后a = “hello”就不行了 “hello”赋值的值是一个地址,而a虽然也有地址,可是这与指针是不同的,指针的值是地址,而数组的值虽然也是地址,可是倒是一个常量,因此不能给常量赋值。

代码测试

#include <stdio.h> 

int main()

{

       char *p = "hello";

       printf("%s",p);

       char a[10];

       a = "hello";

       return 0;

}

error C2440: '=' : cannot convert from 'char [6]' to 'char [10]'

        There is no context in which this conversion is possible

看到这样的错误提示,你是否会想到把char a[10]改为char a[6]呢

试一下,

error C2106: '=' : left operand must be l-value

运算符的左边应该是一个“左值”。所谓“左值”就是指在程序中占用内存空间、能够被修改的量,好比各类变量。 

 

继续扩展问题:

在使用指针的时候,指针能够自增,而数组不能自增

编译器给数组分配了空间,数组a的地址就是一个常量了,让常量自增这确定是不行的。 

继续扩展:

      在指针自增的时候,编译器会自动识别类型,好比指针是指向int型的,想获取下一个的地址时,指针直接p++就好了,不要画蛇添足的p+4了

      特别须要注意的是,在void指针使用的时候,不能使用指针运算,应为void型编译器不能识别类型的长度(即指针所指对象的体积),p++这样就是不合法的,即不能进行数学运算,也不能使用*取值操做,想使用必须转换为其它的类型.

 

 

1.以字符串形式出现的,编译器都会为该字符串自动添加一个0做为结束符,如在代码中写
  "abc",那么编译器帮你存储的是"abc\0"

2."abc"是常量吗?答案是有时是,有时不是。

  不是常量的状况:"abc"做为字符数组初始值的时候就不是,如
                  char str[] = "abc";
    由于定义的是一个字符数组,因此就至关于定义了一些空间来存放"abc",而又由于
    字符数组就是把字符一个一个地存放的,因此编译器把这个语句解析为
    char str[3] = {'a','b','c'};
                  又根据上面的总结1,因此char str[] = "abc";的最终结果是
    char str[4] = {'a','b','c','\0'};
    作一下扩展,若是char str[] = "abc";是在函数内部写的话,那么这里
    的"abc\0"由于不是常量,因此应该被放在栈上。
  
  是常量的状况:  把"abc"赋给一个字符指针变量时,如
                  char* ptr = "abc";
    由于定义的是一个普通字符指针,并无定义空间来存放"abc",因此编译器得帮咱们
    找地方来放"abc",显然,把这里的"abc"当成常量并把它放到程序的常量区是编译器
    最合适的选择。因此尽管ptr的类型不是const char*,而且ptr[0] = 'x';也能编译
    经过,可是执行ptr[0] = 'x';就会发生运行时异常,由于这个语句试图去修改程序
    常量区中的东西。
    记得哪本书中曾经说过char* ptr = "abc";这种写法原来在c++标准中是不容许的,
    可是由于这种写法在c中实在是太多了,为了兼容c,不容许也得容许。虽然容许,
    可是建议的写法应该是const char* ptr = "abc";这样若是后面写ptr[0] = 'x'的
    话编译器就不会让它编译经过,也就避免了上面说的运行时异常。
    又扩展一下,若是char* ptr = "abc";写在函数体内,那么虽然这里的"abc\0"被
    放在常量区中,可是ptr自己只是一个普通的指针变量,因此ptr是被放在栈上的,
    只不过是它所指向的东西被放在常量区罢了。

3.数组的类型是由该数组所存放的东西的类型以及数组自己的大小决定的。
  如char s1[3]和char s2[4],s1的类型就是char[3],s2的类型就是char[4],
  也就是说尽管s1和s2都是字符数组,但二者的类型倒是不一样的。

4.字符串常量的类型能够理解为相应字符常量数组的类型,
  如"abcdef"的类型就能够当作是const char[7]

5.sizeof是用来求类型的字节数的。如int a;那么不管sizeof(int)或者是sizeof(a)都
  是等于4,由于sizeof(a)其实就是sizeof(type of a)

6.对于函数参数列表中的以数组类型书写的形式参数,编译器把其解释为普通
  的指针类型,如对于void func(char sa[100],int ia[20],char *p)
  则sa的类型为char*,ia的类型为int*,p的类型为char*


7.根据上面的总结,来实战一下:
  对于char str[] = "abcdef";就有sizeof(str) == 7,由于str的类型是char[7],
  也有sizeof("abcdef") == 7,由于"abcdef"的类型是const char[7]。
  对于char *ptr = "abcdef";就有sizeof(ptr) == 4,由于ptr的类型是char*。
  对于char str2[10] = "abcdef";就有sizeof(str2) == 10,由于str2的类型是char[10]。
  对于void func(char sa[100],int ia[20],char *p);
  就有sizeof(sa) == sizeof(ia) == sizeof(p) == 4,
  由于sa的类型是char*, ia的类型是int*,p的类型是char*。

4、

这几天搞Unix上的C程序,里面用到了不少字符数组和字符串指针,我记得在学完C语言后至关一段时间里,对指针这个东西仍是模模糊糊,后来工做也没怎么用到过C,虽然网上这类的文章也有不少,仍是决定本身在这作个小总结,也算加深下本身的印象,写了下面的测试程序:

#include <stdio.h>

int main(int argc, char *argv[])
{

  char day[15] = "abcdefghijklmn";
  char* strTmp = "opqrstuvwxyz";

  printf("&day is %x\n",&day);
  printf("&day[0] is %x\n",&day[0]);
  printf("day is %x\n",day);
  
  printf("\n&strTmp is %x\n",&strTmp);
  printf("&strTmp[0] is %x\n",&strTmp[0]);
  printf("strTmp is %x\n",strTmp);
  
  getchar(); 
  return 0;
}

运行后屏幕上获得以下结果:


其实看到结果估计不少东西就好明白了,

    先看看前三个输出也就是关于变量day的,在 char day[15] = "abcdefghijklmn"; 这个语句执行的时候,系统就分配了一段长15的内存,并把这段内存起名为day,里面的值为"abcdefghijklmn",以下图所示:

        再看程序,第一个输出,&day,&号是地址运算符,也就是day这个变量的内存地址,很明显,在最前面,也就是a字符所在字节的地址;
        对于第二个输出也就好理解了,&day[0],就是day数组中第一个变量(也就是a)的地址,所以他们两个是同样的;
        第三个输出是day,对于数组变量,可使用变量名来索引变量中的内容,其实这里的day能够理解成数组变量退化的指针,而且指向数组的开头,既然把它理解成指针,那么它的值确定是地址了,因此他的值和上面两个也同样。

    再看看后面三个输出,关于字符串指针strTmp,在执行char* strTmp = "opqrstuvwxyz";后,内存的图示以下:


如图所示,内存分配了两段内存,一个名为strTmp,类型是一个字符指针,另一段是一个字符串常量,且strTmp里面存放着字符常量的首地址,注意这里没法经过strTmp修改这段字符串,由于是常量;因而程序中的后面三个输出就好理解了;
    
  &strTmp:strTmp这个字符指针的地址
  &strTmp[0]:strTmp所指字符常量第一个字符的地址
  strTmp:strTmp这个字符指针的值,即字符常量的首地址

所以,最后两个的值是同样的。
      指针能够这样理解,指针这种类型,和int,char,double等等是同样的,只是它用来保存地址值的,而int变量保存整数,char变量保存字符,仅此而已,就char型指针或者int指针,本质是同样的,都是存放的地址,只不过那个地址所里面的变量类型不一样而已,还有一种void型指针,就是能够听任何类型变量的地址。

5、我的代码以及注释,纯属我的理解,定有不妥之处,望批评指正:

#include <stdio.h>

int main(int argc, char *argv[])
{
 char* strTmp = "abcd";
 printf("strTmp is %s\n",strTmp);//将字符串常量"abcd"的地址所隐含的内容转换成“string类型”
 printf("strTmp is %d\n",strTmp);//将字符串常量"abcd"的地址转换成int类型,这里不一样的机子不一样的时间的运行结果可能会不同,由于地址可能会发生变化
 printf("strTmp is %c\n",strTmp);//将字符串常量"abcd"的地址转换成字符型,这里不一样的机子不一样的时间的运行结果可能会不同,由于地址可能会发生变化
 printf("*strTmp is %c\n",*strTmp);//将字符串常量"abcd"的地址所隐含的内容转换成字符型,由下面注释的这句会抛出异常可知,这里并没有截取字符串,*strTmp长度自己就是1
 //printf("*strTmp is %s\n",*strTmp);//不能将字符转换成字符串型
 getchar(); 
 return 0;
}

 6、后来又有看到下面这样的说法可供读者参考:

1. C语言中没有字符串类型,只有用字符数组来表示。这和c++中string是有区别的,C++中string是能够直接赋值如string s;s="Hello world";可是C语言中的字符数组却不能这样。因此,这里的strTmp能够理解为字符数组的首地址,也能够用它表明整个字符数组,因此能输出全部字符数组中的内容。

 2.字符串就是字符数组或者是指针。 内存实现都同样的。 数组名字就是一个指针。

char ch[100] ;
char *p;
p =ch;

3.定义的字符串方式举例:

字符串定义其实很简单在c/c++语言中定义一个字符串可使用以下的语法:

char *s1=“string1”;//定义字符串常量,指针形式

char s2[]=“string2”;//定义字符串常量,数组形式

char *s3=new char[10];//定义字符串变量并分配内存 指针形式

strcpy(s3,"string3");//为s3赋值

char s4[10];//定义字符串变量,数组形式

strcpy(s4,"string4");//为s4赋值

以上四种方法都能定义一个字符串,同时经过字符串在内存中的分布能够清楚地知道是什么状况

 

4. C语言中字符串赋值方法strcpy(char*d,char*s)其中s表明是源字符串,d表明目标字符串,也就是你要赋值的字符串。

5.c语言中的字符串跟Java或c++中的字符串不一样。如char *p;其中p是一个指针,p中存储一个内存缓冲区的首地址。所谓的内存缓冲区就是一段连续的内存地址,里面存放了一系列的字符。那系统又是如何判断在哪里结束呢。那就是根据符号‘\0’。这个字符占一个字节,8位,每位的值都是0。

相关文章
相关标签/搜索