数据清洗一:

   原数据格式:    转换的目标格式:   脚本目的:转换数据的格式,属于数据清洗部分。 脚本逻辑,将文件读取后,将第一列设置为key,第三列设为列表组成的value,建立dict;然后循环dict来统计items两两之间重复的id以及其数目。 #!/usr/bin/python import sys import pandas as pd f1=sys.argv[1] f2=sys.argv
相关文章
相关标签/搜索