C/C++的参数传递机制

时间 2019-11-18

标签 c++ 参数传递机制栏目 C&C++ 繁體版

原文原文链接

近来公司招人较多，由此面试了很是多的C++程序员。面试时，我都会问到参数传递的相关问题，尤为侧重指针。由于指针毕竟是C/C++最重要的一个优点(在某种状况下也能够说是劣势)。但其结果是，1/3的人基本上讲错了，1/3的知其然殊不知其因此然。因此我以为有必要把这些知识点梳理下，分享出来。(下面的讨论都是基于VS和GCC的默认编译方式，其余特殊编译方式不在本文做用范围内。)程序员

C/C++函数参数的传递方式有三种：值传递（pass by value）、指针传递（pass bypointer）、引用传递（pass by reference）。面试

C/C++函数参数的传递通道是经过堆栈传递，默认遵循__cdecl(C声明方式)，参数由调用者从右往左逐个压入堆栈，在函数调用完成以后再由调用者恢复堆栈。(Win32API遵循stdcall传参规范的,不在本文讨论范围)函数

下面是测试代码测试

void Swap(__int64* _pnX, __int64* _pnY)
{
    __int64 nTemp = *_pnX;
    *_pnX = *_pnY;
    *_pnY = nTemp;
}

void Swap(__int64& _nX, __int64& _nY)
{
    __int64 nTemp = _nX;
    _nX = _nY;
    _nY = nTemp;
}

void SetValue(__int64 _nX)
{
    __int64 nTemp = _nX;
}

// Test001
void GetMemory(__int64* _pBuff)
{
    _pBuff = new __int64[4];
}

// Test002
void GetMemory(__int64** _ppBuff)
{
    *_ppBuff = new __int64[4];
}

int _tmain(int argc, _TCHAR* argv[])
{
    __int64 nA = 0x10;
    __int64 nB = 0x20;

    // Test to pass by pointer
    Swap(&nA, &nB);

    // Test to pass by reference
    Swap(nA, nB);

    // Test to pass by value
    SetValue(nA);

    // Test the pointer that points the pointer
    __int64* _pArray = NULL;
    GetMemory(&_pArray);
    delete[] _pArray;
    _pArray = NULL;

    // Test the pointer 
    GetMemory(_pArray);

    return 0;
}

指针传递和引用传递spa

// 下面看一下对应的反汇编的代码(VS版）
__int64 nA = 0x10;
0041370E  mov         dword ptr [nA],10h 
00413715  mov         dword ptr [ebp-8],0 
__int64 nB = 0x20;
0041371C  mov         dword ptr [nB],20h 
00413723  mov         dword ptr [ebp-18h],0 

// Test to pass by pointer
Swap(&nA, &nB);
0041372A  lea         eax,[nB] 
0041372D  push        eax  
0041372E  lea         ecx,[nA] 
00413731  push        ecx  
00413732  call        Swap (4111E5h) 
00413737  add         esp,8 

// Test to pass by reference
Swap(nA, nB);
0041373A  lea         eax,[nB] 
0041373D  push        eax  
0041373E  lea         ecx,[nA] 
00413741  push        ecx  
00413742  call        Swap (4111E0h) 
00413747  add         esp,8 

// GCC版
   0x00401582 <+30>:    lea    eax,[esp+0x18]
   0x00401586 <+34>:    mov    DWORD PTR [esp+0x4],eax
   0x0040158a <+38>:    lea    eax,[esp+0x1c]
   0x0040158e <+42>:    mov    DWORD PTR [esp],eax
   0x00401591 <+45>:    call   0x401520 <Swap(int*, int*)>
   0x00401596 <+50>:    lea    eax,[esp+0x18]
   0x0040159a <+54>:    mov    DWORD PTR [esp+0x4],eax
   0x0040159e <+58>:    lea    eax,[esp+0x1c]
   0x004015a2 <+62>:    mov    DWORD PTR [esp],eax
   0x004015a5 <+65>:    call   0x401542 <Swap(int&, int&)>

经过上面的反汇编代码，咱们能够看出指针传递和引用传递在机制是同样的，都是将指针值(即地址)压入栈中，调用函数，而后恢复栈。Swap(nA, nB)和Swap(&nA, &nB);在实际上的汇编代码也基本上如出一辙，都是从栈中取出地址来。由此能够看出引用和指针在效率上是同样的。这也是为何指针和引用均可以达到多态的效果。指针传递和引用传递其实都是改变的地址指向的内存上的值来达到修改参数的效果。指针

值传递code

下面是值传递对应的反汇编代码blog

// Test to pass by value
SetValue(nA);
0041374A  mov         eax,dword ptr [ebp-8] 
0041374D  push        eax  
0041374E  mov         ecx,dword ptr [nA] 
00413751  push        ecx  
00413752  call        SetValue (4111EAh) 
00413757  add         esp,8

由于个人机器是32位的CPU,从上面的汇编代码能够看64Bit的变量被分红2个32Bit的参数压入栈中。这也是咱们常说的，值传递会造成一个拷贝。若是是一个自定义的结构类型，而且有不少参数，那么若是用值传递，这个结构体将被分割为很是多个32Bit的逐个拷贝到栈中去，这样的参数传递效率是很是慢的。因此结构体等自定义类型，都使用引用传递，若是不但愿别人修改结构体变量，能够加上const修饰，如(const MY_STRUCT& _value);内存

下面来看一下Test001函数对应的反汇编代码的参数传递it

__int64* _pArray = NULL;
004137E0  mov         dword ptr [_pArray],0 
// Test the pointer 
GetMemory(_pArray);
00413812  mov         eax,dword ptr [_pArray] 
00413815  push        eax  
00413816  call        GetMemory (411203h) 
0041381B  add         esp,4

从上面的汇编代码能够看出，实际上是0被压入到栈中做为参数，因此GetMemory(_pArray)不管作什么事，其实都与指针变量_pArray无关。GetMemory()分配的空间是让栈中的临时变量指向的，当函数退出时，栈获得恢复，结果申请的空间没有人管，就产生内存泄露的问题了。《C++ Primer》将参数传递分为引用传递和非引用传递两种，非引用传递其实能够理解为值传递。这样看来，指针传递在某种意义上也是值传递，由于传递的是指针的值(1个4BYTE的值)。值传递都不会改变传入实参的值的。并且普通的指针传递实际上是改变的指针变量指向的内容。

下面再看一下Test002函数对应的反汇编代码的参数传递

__int64* _pArray = NULL;
004137E0  mov         dword ptr [_pArray],0 
GetMemory(&_pArray);
004137E7  lea         eax,[_pArray] 
004137EA  push        eax  
004137EB  call        GetMemory (4111FEh) 

004137F0  add         esp,4

从上面的汇编代码lea eax,[_pArray] 能够看出，_pArray的地址被压入到栈中去了。

而后看一看GetMemory(&_pArray)的实现汇编代码。

0x0040159b <+0>: push ebp

0x0040159c <+1>: mov ebp,esp

0x0040159e <+3>: sub esp,0x18

0x004015a1 <+6>: mov DWORD PTR [esp],0x20

0x004015a8 <+13>: call 0x473ef0 <_Znaj>

0x004015ad <+18>: mov edx,DWORD PTR [ebp+0x8]

0x004015b0 <+21>: mov DWORD PTR [edx],eax

0x004015b2 <+23>: leave

0x004015b3 <+24>: ret

蓝色的代码是分配临时变量空间，而后调用分配空间函数分配空间,获得的空间指针即eax.

而后红色的汇编代码即从ebp+0x8的栈上取到上面压入栈中的参数_pArray的地址.

mov DWORD PTR [edx],eax即至关于把分配的空间指针eax让edx指向，也即让_pArray指向分配的空间eax.

总之，不管是哪一种参数传递方式，参数都是经过栈上的临时变量来间接参与到被调用函数的。指针做为参数，其自己的值是不可能被改变的，可以改变的是其指向的内容。引用是经过指针来实现的，因此引用和指针在效率上同样的。