std::function源码分析

时间 2019-11-13

标签 std function 源码分析繁體版

原文原文链接

##概览c++

###std::function 安全

template<class _Rp, class ..._ArgTypes>
class function<_Rp(_ArgTypes...)>
    : public __function::__maybe_derive_from_unary_function<_Rp(_ArgTypes...)>,
      public __function::__maybe_derive_from_binary_function<_Rp(_ArgTypes...)>
{
        __base* __f_; //points to __func
        aligned_storage< 3 *sizeof(void *)>::type 	__buf_;
        //...
};

std::function最重要的部分就是这个__base*指针，及其所指向的存储了实际可调用对象的多态类__func。__base类充当了__func类的接口，定义了clone、operator()等纯虚函数。app

而__func对象可能存储的区域之一就是自带的默认缓冲区__buf_,部分MIPS指令集要求指令必需要对齐，因此这里的存储地址也要遵循平台默认的对齐方式。默认的大小是3*sizeof(void*)，这是纯经验数据，对大部分的函数指针以及成员函数指针这个大小都够用（经@Anthonyhl提示，加上base*指针，__func对象总大小应该刚好是4*sizeof(void*)）。但由于可调用对象大小变幻无穷，因此实际存储的区域可能也会在新开的堆上。函数

std::function类继承自__maybe_derive_from_unary_function与__maybe_derive_from_binary_function两个类。这两个类在函数分别知足ResultT f(ArgT)和ResultT f(Arg1T, Arg2T)形式的时候，分别会特化继承std::unary_function<ResultT, ArgT>与std::binary_function<ResultT, arg1T, arg2T>。这两个类是C++11以前对两种特殊可调用对象的静态接口，其内只有typedef，在C++11以后已经deprecated，C++17后将移除，这里继承这两个接口只是为了兼容目的。关于C++11以前的<functional>分析，详见这篇文章。post

###__func 性能

template<class _Fp, class _Alloc, class _Rp, class ..._ArgTypes>
class __func<_Fp, _Alloc, _Rp(_ArgTypes...)>
    : public  __base<_Rp(_ArgTypes...)>
{
    __compressed_pair<_Fp, _Alloc> __f_;
    //...
};

__func是实际存储可调用对象的类，其继承了__base这个接口。可调用对象与allocator都被存储在一个__compressed_pair当中。this

###__base指针

template<class _Rp, class ..._ArgTypes>
class __base<_Rp(_ArgTypes...)>
{
    __base(const __base&);
    __base& operator=(const __base&);
public:
    __base() {}
    virtual ~__base() {}
    virtual __base* __clone() const = 0;
    virtual void __clone(__base*) const = 0;
    virtual void destroy() _NOEXCEPT = 0;
    virtual void destroy_deallocate() _NOEXCEPT = 0;
    virtual _Rp operator()(_ArgTypes&& ...) = 0;
#ifndef _LIBCPP_NO_RTTI
    virtual const void* target(const type_info&) const _NOEXCEPT = 0;
    virtual const std::type_info& target_type() const _NOEXCEPT = 0;
#endif  // _LIBCPP_NO_RTTI
};

__base是一个纯虚基类，是__func类的接口，对外提供了clone(复制、移动）、destroy（析构）、operator()（调用）等函数。 ##构造从可调用对象构造出function有如下几步：code

检查该对象是否可调用
若缓冲区__buf_不够存放可调用对象，新开内存
在__f_指向的内存区域调用placement new，移动构造可调用对象。

###对象是否可调用对象

template<class _Rp, class ..._ArgTypes>
template <class _Fp>
function<_Rp(_ArgTypes...)>::function(_Fp __f,
    typename enable_if
        <
            __callable<_Fp>::value &&
            !is_same<_Fp, function>::value
        >::type*) //使用SFINAE检查该对象是否可调用，而且不是std::function（防止出现function套function的状况）。

    : __f_(0)

在滚到下面以前，先猜一下__callable是怎么实现的。注意如下代码也是合法的，还要考虑reference_wrapper、返回值转化等各类形式：

struct A
{
    void f() { cout << "called" << endl;}
};

int main()
{
    void (A::*mfp)() = &A::f;
    std::function<void(A*)> f(mfp);
    A a;
    f(&a);
}

实际上，实现__callable主要依赖于invoke的实现，invoke规定了一个统一的调用方式，将于C++17标准中出现。不管是f(a,b)仍是(f.*a)(b)（f是可调用对象，a是成员函数指针）仍是(a->*f)(b)（a是可调用对象指针，f是成员函数指针），均可以以invoke(f,a,b)的形式调用。

知道了这个函数，咱们只要规定invoke能够调用，而且返回值能够转换成std::function规定的返回类型的函数就是callable：

template <class _Fp, bool = !is_same<_Fp, function>::value &&
                                __invokable<_Fp&, _ArgTypes...>::value> //__invokable表明是否这一些类型是否能够发生调用
        struct __callable;
    template <class _Fp>
        struct __callable<_Fp, true>
        { //若是能够发生调用，继续检查返回值是否能够转换成function的返回值
            static const bool value = is_same<void, _Rp>::value || //实际任何类型的T fun(...)都能被绑定到void fun(...)，但T对void不是convertible
                is_convertible<typename __invoke_of<_Fp&, _ArgTypes...>::type,
                               _Rp>::value;
        };
    template <class _Fp>
        struct __callable<_Fp, false>
        {
            static const bool value = false;
        };

题外话，有人在C++17当中提出统一x.f(a,b)与f(x,a,b)，应该会给invoke当前的复杂状况带来一点帮助：http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2014/n4165.pdf

###内存分配与构造

####function 为了保证异常安全。分为两种状况：若自带的__buf_大小够大，且可调用对象的构造函数不抛出异常，则直接构造；不然，则用unique_ptr来处理allocator分配出的内存地址，再在上面调用构造函数，这样即便构造函数抛出了异常，unique_ptr也会自动delete掉指向的内存地址；而若是用裸指针，构造函数抛出异常就会内存泄漏。

if (__not_null(__f))
    {
        typedef __function::__func<_Fp, allocator<_Fp>, _Rp(_ArgTypes...)> _FF;
        if (sizeof(_FF) <= sizeof(__buf_) && is_nothrow_copy_constructible<_Fp>::value) //缓冲区够大，构造函数不抛异常
        {
            __f_ = (__base*)&__buf_; //__f_指向缓冲区
            ::new (__f_) _FF(_VSTD::move(__f)); //直接构造，间接调用了__func的移动构造函数
        }
        else
        {
            typedef allocator<_FF> _Ap;
            _Ap __a;
            typedef __allocator_destructor<_Ap> _Dp;
            unique_ptr<__base, _Dp> __hold(__a.allocate(1), _Dp(__a, 1)); //__a.allocate(1)分配了一个对象的内存，用unique_ptr保护起来
            ::new (__hold.get()) _FF(_VSTD::move(__f), allocator<_Fp>(__a)); //placement new, 在指定的内存地址调用__func的构造函数。这一步new可能会抛异常，unique_ptr在异常时会自动析构并delete内存空间
            __f_ = __hold.release(); //安全了，把指针的控制权移交给__f_
        }
    }

####__func 这个构造函数之中调用了__func类的构造函数：

__compressed_pair<_Fp, _Alloc> __f_; //__func的的__f_是一个compressed_pair, 不是上面的base*指针

    explicit __func(_Fp&& __f, _Alloc&& __a)
        : __f_(piecewise_construct, _VSTD::forward_as_tuple(_VSTD::move(__f)),
                                    _VSTD::forward_as_tuple(_VSTD::move(__a))) {}

首先介绍下这个compressed_pair, 众所周知C++的空类默认也会占空间：

struct Null {};
struct Test { int a; };

struct B
{
    Null n;
    Test c;
};

    cout << sizeof(Null) << " "<< sizeof(Test)<<" "<<sizeof(B)<<endl; //1 4 8

但这样在有内存对其的时候其实浪费了大量的存储空间，特别是对于function这类小对象来讲节约空间很是重要。对于空类Null，一个继承自它的类B2，且B2非空类，则B2不会由于Null类的继承而像上例中的内含同样占用空间：

struct B1 : private Null
{
};
struct B2 : private B1, private Test
{
};
    cout << sizeof(B1)<<" "<<sizeof(B2) << endl; // 1 4

compressed_pair就用了这种技巧来压缩内存，这种技术在boost::compressed_pair当中已经有成熟的库，这里libc++内部也制做了一个本身的__compressed_pair。

再来讲说这个piecewise_construct。通常使用pair时，咱们都是利用make_pair(T1(arg1, arg2), T2(arg))这样来构造。实际上，发生了如下的步骤：

构造出一个T1的xvalue(消亡值，属于右值)，匹配上make_pair(T1&&, T2&&)
make_pair把这两个右值引用传递给pair<T1, T2>(T1&& t1, T2&& t2)
pair的构造函数把内部的first, second对象在初始化列表中以first(t1), second(t2)形式初始化，这个t1,t2都是右值，因此调用了移动构造函数

至关于咱们构造了一个临时对象，而后又调用了移动构造函数。这样就有一个问题：若是没有移动构造函数怎么办？piecewise_construct就是为此而生的。使用pair<T1, T2>(piecewise_construct, tuple<Args...>&& t1, tuple<Args...>&& t2)这样的形式，最终初始化列表中会直接转化成: first(std::forward<_Args1>(std::get<_I1>( __first_args))...)，即这些参数会被直接传递给first,second对象，直接在pair的构造函数内初始化first second，而不是先在造成参数时构造出临时对象，再移动过去。这样既有比较好的性能，也不须要具备first,second具备复制、移动构造函数。

##复制与移动复制与移动实际上都是操做内部的__func对象。可是，构造函数不具备多态性，怎么根据父类的指针来得到子类的拷贝呢？这是一种经常使用的技巧：

virtual SuperClass* SubClass::clone() { return new SubClass(*this); } //至关于多态new
virtual SuperClass* SubClass::clone(SuperClass* p) { return new (p) SubClass(*this); } //多态placement new

###复制构造

//.__f_是指向__func对象的指针
template<class _Rp, class ..._ArgTypes>
function<_Rp(_ArgTypes...)>::function(const function& __f)
{
    if (__f.__f_ == 0) //未初始化
        __f_ = 0;
    else if (__f.__f_ == (const __base*)&__f.__buf_) //另外一个对象的__func存放在自身的缓冲区内，既然在缓冲区内能放下，也应该能在个人缓冲区内放下
    {
        __f_ = (__base*)&__buf_; //本身指向自身的缓冲区
        __f.__f_->__clone(__f_); //至关于new (__f_) __func(另外一个__func)，把另外一个__func复制到自身缓冲区内
    }
    else
        __f_ = __f.__f_->__clone(); //放不下了，让它新开一块内存复制到其中，而后本身指过去
}

###移动构造

template<class _Rp, class ..._ArgTypes>
function<_Rp(_ArgTypes...)>::function(function&& __f) _NOEXCEPT
{
    if (__f.__f_ == 0)
        __f_ = 0;
    else if (__f.__f_ == (__base*)&__f.__buf_) //__func在缓冲区，缓冲区够用
    {
        __f_ = (__base*)&__buf_; //不能直接指到对方缓冲区去，由于对方__buf会随对象析构销毁掉
        __f.__f_->__clone(__f_); //仍是要复制到本身的缓冲区来
    }
    else
    {
        __f_ = __f.__f_; //对方的__func在堆上，直接指过去
        __f.__f_ = 0; //把对方的__f_指空
    }
}

##调用

调用的时候先检查内部的__f_指针是否为空，若空则抛异常，不然调用__f_指向的__func对象的operator():

template<class _Rp, class ..._ArgTypes>
_Rp
function<_Rp(_ArgTypes...)>::operator()(_ArgTypes... __arg) const
{
#ifndef _LIBCPP_NO_EXCEPTIONS
    if (__f_ == 0)
        throw bad_function_call();
#endif  // _LIBCPP_NO_EXCEPTIONS
    return (*__f_)(_VSTD::forward<_ArgTypes>(__arg)...); //调用内部__func对象的operator()
}

`ArgType`	`forward<ArgType>`
`T`	`static_cast<T&&>`
`T&`	`static_cast<T&>`
`T&&`	`static_cast<T&&>`

std::forward做用如其名，即将参数向前传递。原先的ArgType=T时，在调用这个函数时已经复制过了一遍，所以复制过的值能够做为右值，forward<T>(t)将t转成了右值。而对于原先是左值、右值引用的来讲，则不能都做为右值处理，而应保持它们自己的类别。

template<class _Fp, class _Alloc, class _Rp, class ..._ArgTypes>
_Rp
__func<_Fp, _Alloc, _Rp(_ArgTypes...)>::operator()(_ArgTypes&& ... __arg) //完美转发
{
    typedef __invoke_void_return_wrapper<_Rp> _Invoker; //后述，与invoke的特殊语法有关
    return _Invoker::__call(__f_.first(), _VSTD::forward<_ArgTypes>(__arg)...); //__f_.first()便可调用对象
}

这里不直接return invoke(__f_.first(), ...)的缘由是，若是__f_的返回值是void，但实际可调用对象返回值，就会出错：

int foo() { return 42; }
void bar() { return foo(); } //报错,int不能转成void
void bar2() { foo(); } //针对void返回值这样才对
function<void()> f(foo); //合法

因此针对void返回值要特化一下：

template <class _Ret>
struct __invoke_void_return_wrapper
{
    template <class ..._Args>
    static _Ret __call(_Args&&... __args)
    {
        return __invoke(_VSTD::forward<_Args>(__args)...);
    }
};

template <>
struct __invoke_void_return_wrapper<void>
{
    template <class ..._Args>
    static void __call(_Args&&... __args)
    {
        __invoke(_VSTD::forward<_Args>(__args)...);
    }
};

仔细思考一下整个调用过程，发现仍是具备负担的：对于形参是T的对象来讲，

void foo(A) {}
A a;

foo(a); //a被复制构造一次

function<void(A)> f(foo);
f(a); //先被复制构造一次，再被移动构造一次
// 等价于
A b(a); //这个复制发生在function::operator()的形参表里
foo(forward<A>(b)); //发生了移动构造

因此在C++11中，移动构造很是重要，若是可以定义移动构造函数请务一定义。不然该例就会退化到两次复制构造，若是在传递大对象时将是不小的负担。

##总结

std::function是自带的可调用对象适配器。它经过内部__f_指针调用所指向的__func类对象的虚方法来实现多态的函数调用、new与placement new。其中内带了一个大小是3*sizeof(void*)的缓冲区，小对象将被分配在缓冲区上，大对象将另外在堆上分配内存存储。
__func对象利用了compressed_pair技术来压缩存储的可调用对象 - Allocator对，并利用piecewise_construct来就地构造这两个对象，可以处理这两个类没有移动复制构造函数的状况，也提升了性能。
std::function在形参是非引用时会多发生一次移动构造，可能成为性能的瓶颈。