初学编程的小伙伴都会对于深浅拷贝的用法有些疑问,今天咱们就结合python变量存储的特性从内存的角度来谈一谈赋值和深浅拷贝~~~python
在详细的了解python中赋值、copy和deepcopy以前,咱们仍是要花一点时间来了解一下python内存中变量的存储状况。编程
在高级语言中,变量是对内存及其地址的抽象。对于python而言,python的一切变量都是对象,变量的存储,采用了引用语义的方式,存储的只是一个变量的值所在的内存地址,而不是这个变量的只自己。数据结构
引用语义:在python中,变量保存的是对象(值)的引用,咱们称为引用语义。采用这种方式,变量所需的存储空间大小一致,由于变量只是保存了一个引用。也被称为对象语义和指针语义。
值语义:有些语言采用的不是这种方式,它们把变量的值直接保存在变量的存储区里,这种方式被咱们称为值语义,例如C语言,采用这种存储方式,每个变量在内存中所占的空间就要根据变量实际的大小而定,没法固定下来。
值语义和引用语义的区别:
值语义: 死的、 傻的、 简单的、 具体的、 可复制的
引用语义: 活的、 聪明的、 复杂的、 抽象的、 不可复制的
咱们来看一张简单易懂的图理解一下python的引用语义和C语言值语义在内存中的存储状况,左右两个图,分别表示了python中变量存储与C语言中变量存储区别:编程语言
在python中的数据类型包括:bool、int、long、float、str、set、list、tuple、dict等等。咱们能够大体将这些数据类型归类为简单数据类型和复杂的数据结构。ide
个人划分标准是,若是一个数据类型,能够将其余的数据类型做为本身的元素,我就认为这是一种数据结构。数据结构的分类有不少种,可是在Python中经常使用的只有集合、序列和映射三种结构。对应python中的set、list(tuple、str)、dict;经常使用的数据类型有int、long、float、bool、str等类型。(其中,str类型比较特别,由于从C语言的角度来讲,str实际上是一个char的集合,可是这与本文的关联不大,因此咱们暂时不谈这个问题)
因为python中的变量都是采用的引用语义,数据结构能够包含基础数据类型,致使了在python中数据的存储是下图这种状况,每一个变量中都存储了这个变量的地址,而不是值自己;对于复杂的数据结构来讲,里面的存储的也只只是每一个元素的地址而已。:spa
1.数据类型从新初始化对python语义引用的影响3d
变量的每一次初始化,都开辟了一个新的空间,将新内容的地址赋值给变量。对于下图来讲,咱们重复的给str1赋值,其实在内存中的变化以下右图:指针
从上图咱们能够看出,str1在重复的初始化过程当中,是由于str1中存储的元素地址由'hello world'的地址变成了'new hello world'的。code
2.数据结构内部元素变化重对python语义引用的影响对象
对于复杂的数据类型来讲,改变其内部的值对于变量的影响:
当对列表中的元素进行一些增删改的操做的时候,是不会影响到lst1列表自己对于整个列表地址的,只会改变其内部元素的地址引用。但是当咱们对于一个列表从新初始化(赋值)的时候,就给lst1这个变量从新赋予了一个地址,覆盖了本来列表的地址,这个时候,lst1列表的内存id就发生了改变。上面这个道理用在全部复杂的数据类型中都是同样的。
搞明白了上面的内容,再来探讨变量的赋值,就变得很是简单了。
1.str的赋值
咱们刚刚已经知道,str1的再次初始化(赋值)会致使内存地址的改变,从上图的结果咱们能够看出修改了str1以后,被赋值的str2从内存地址到值都没有受到影响。
看内存中的变化,起始的赋值操做让str1和str2变量都存储了‘hello world’所在的地址,从新对str1初始化,使str1中存储的地址发生了改变,指向了新建的值,此时str2变量存储的内存地址并未改变,因此不受影响。
2.复杂的数据结构中的赋值
刚刚咱们看了简单数据类型的赋值,如今来看复杂数据结构变化对应内存的影响。
上图对列表的增长修改操做,没有改变列表的内存地址,lst1和lst2都发生了变化。
对照内存图咱们不难看出,在列表中添加新值时,列表中又多存储了一个新元素的地址,而列表自己的地址没有变化,因此lst1和lst2的id均没有改变而且都被添加了一个新的元素。
简单的比喻一下,咱们出去吃饭,lst1和lst2就像是同桌吃饭的两我的,两我的公用一张桌子,只要桌子不变,桌子上的菜发生了变化两我的是共同感觉的。
咱们已经详细了解了变量赋值的过程。对于复杂的数据结构来讲,赋值就等于彻底共享了资源,一个值的改变会彻底被另外一个值共享。
然而有的时候,咱们恰恰须要将一份数据的原始内容保留一份,再去处理数据,这个时候使用赋值就不够明智了。python为这种需求提供了copy模块。提供了两种主要的copy方法,一种是普通的copy,另外一种是deepcopy。咱们称前者是浅拷贝,后者为深拷贝。
深浅拷贝一直是全部编程语言的重要知识点,下面咱们就从内存的角度来分析一下二者的区别。
首先,咱们来了解一下浅拷贝。浅拷贝:无论多么复杂的数据结构,浅拷贝都只会copy一层。下面就让咱们看一张图,来了解一下浅浅拷贝的概念。
看上面两张图,咱们加入左图表示的是一个列表sourcelist,sourcelist = ['str1','str2','str3','str4','str5',['str1','str2','str3','str4','str5']];
右图在原有的基础上多出了一个浅拷贝的copylist,copylist = ['str1','str2','str3','str4','str5',['str1','str2','str3','str4','str5']];
sourcelist和copylist表面上看起来如出一辙,可是实际上在内存中已经生成了一个新列表,copy了sourceLst,得到了一个新列表,存储了5个字符串和一个列表所在内存的地址。
咱们看下面分别对两个列表进行的操做,红色的框框里面是变量初始化,初始化了上面的两个列表;咱们能够分别对这两个列表进行操做,例如插入一个值,咱们会发现什么呢?以下所示:
从上面的代码咱们能够看出,对于sourceLst和copyLst列表添加一个元素,这两个列表好像是独立的同样都分别发生了变化,可是当我修改lst的时候,这两个列表都发生了变化,这是为何呢?咱们就来看一张内存中的变化图:
咱们能够知道sourceLst和copyLst列表中都存储了一坨地址,当咱们修改了sourceLst1的元素时,至关于用'sourceChange'的地址替换了原来'str1'的地址,因此sourceLst的第一个元素发生了变化。而copyLst仍是存储了str1的地址,因此copyLst不会发生改变。
当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变,因此当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。
这种状况发生在字典套字典、列表套字典、字典套列表,列表套列表,以及各类复杂数据结构的嵌套中,因此当咱们的数据类型很复杂的时候,用copy去进行浅拷贝就要很是当心。。。
刚刚咱们了解了浅拷贝的意义,可是在写程序的时候,咱们就是但愿复杂的数据结构之间彻底copy一份而且它们之间又没有一毛钱关系,应该怎么办呢?
咱们引入一个深拷贝的概念,深拷贝——即python的copy模块提供的另外一个deepcopy方法。深拷贝会彻底复制原变量相关的全部数据,在内存中生成一套彻底同样的内容,在这个过程当中咱们对这两个变量中的一个进行任意修改都不会影响其余变量。下面咱们就来试验一下。
看上面的执行结果,这一次咱们不论是对直接对列表进行操做仍是对列表内嵌套的其余数据结构操做,都不会产生拷贝的列表受影响的状况。咱们再来看看这些变量在内存中的情况:
看了上面的内容,咱们就知道了深拷贝的原理。其实深拷贝就是在内存中从新开辟一块空间,无论数据结构多么复杂,只要遇到可能发生改变的数据类型,就从新开辟一块内存空间把内容复制下来,直到最后一层,再也不有复杂的数据类型,就保持其原引用。这样,无论数据结构多么的复杂,数据之间的修改都不会相互影响。这就是深拷贝~~~