Pythonでプラス記号「+」で文字列を接続しない理由

1031 ワード

PythonではStringオブジェクトは固定長オブジェクトであり、作成すると長さは変更できません.+番号で2つの文字列を接続すると、長さの合計長さのメモリが新しく開き、2つの文字列memcpyが挿入されます.N個のStringオブジェクトを接続する場合は、N-1メモリ申請とコピーを行います.
string_concat(register PyStringObject *a, register PyObject *bb)
{
    register Py_ssize_t size;
    register PyStringObject *op;
//................
    op = (PyStringObject *)PyObject_MALLOC(PyStringObject_SIZE + size);
    if (op == NULL)
        return PyErr_NoMemory();
    PyObject_INIT_VAR(op, &PyString_Type, size);
    op->ob_shash = -1;
    op->ob_sstate = SSTATE_NOT_INTERNED;
    Py_MEMCPY(op->ob_sval, a->ob_sval, Py_SIZE(a));
    Py_MEMCPY(op->ob_sval + Py_SIZE(a), b->ob_sval, Py_SIZE(b));
    op->ob_sval[size] = '\0';
    return (PyObject *) op;
#undef b
}

公式に推奨されているのは、リストまたはtupleの要素を接続するのに非常に有効な文字列を使用するjoinメソッドです.彼はまずすべての要素の長さを統計し、メモリを申請し、コピーします.
''.join(['a', 'b', 'c'])    //better
'a' + 'b' + 'c'