数据分析入门——pandas之合并函数merge

merge有点相似SQL中的join,能够将不一样数据集按照某些字段进行合并,获得新的数据集spa

 1.参数一览表:3d

  

2.一对一链接:默认状况下,会按照相同字段的进行链接blog

  例若有相同字段emp的两个df,merge的时候就会根据emp进行链接,且根据参数知道,默认是内链接:im

  

  

  使用默认的不是很明了,一般状况下,咱们推荐使用on明确链接条件,这和SQL里写ON是相似的:数据

  

3.多对一合并规范化

  

 4.多对多链接(交叉链接)db

  

5.key的规范化img

  也就是上面介绍的,经过on来指定链接的key,明了且规范co

  而且,合并的时候,若是有两个相同的列,可是on只指定了一列,另一列相同时则会经过_x,_y等进行区分join

  能够经过参数suffix进行控制:

  

6.经过left_on、right_on指定左右两边的列做为key,这样,当两边列名都不相等时使用

  这样即便两边不相等,也能链接了

  

7.内合并和外合并

  内合并就是保留两边都有的key,这点和SQL内链接的道理是同样的,这是默认的方式,也就是how参数的默认值,再也不赘述

  外合并就是相似SQL的外链接了,对于没有链接上的数据,自动补全为NaN:这也就是SQL的全外链接

  

  其余的left、right同理:

  

  

8.列冲突解决

  也就是前面说的经过on控制列,加suffix来控制,默认值为_x,_y:

  

相关文章
相关标签/搜索