Python中尽可能少用加号“+”链接字符串的缘由

在Python中,String对象是定长对象,一旦建立,长度就不可变化,如果使用+号链接两个字符串,则会新开辟一段长度总和长度的内存,再将两个字符串memcpy进去。若是要链接N个String对象,则要进行N-1次内存申请和拷贝。spa

 

string_concat(register PyStringObject *a, register PyObject *bb)
{
register Py_ssize_t size;
register PyStringObject *op;
//................
op = (PyStringObject *)PyObject_MALLOC(PyStringObject_SIZE + size);
if (op == NULL)
return PyErr_NoMemory();
PyObject_INIT_VAR(op, &PyString_Type, size);
op->ob_shash = -1;
op->ob_sstate = SSTATE_NOT_INTERNED;
Py_MEMCPY(op->ob_sval, a->ob_sval, Py_SIZE(a));
Py_MEMCPY(op->ob_sval + Py_SIZE(a), b->ob_sval, Py_SIZE(b));
op->ob_sval[size] = '\0';
return (PyObject *) op;
#undef b
}

 

官方推荐的是使用字符串的join方法,该方法对于链接一个list或tuple中的元素很是有效,他会先统计全部元素的长度,申请内存,而后拷贝。code

''.join(['a', 'b', 'c']) //better
'a' + 'b' + 'c'
相关文章
相关标签/搜索