字符串、文件操作,英文词频统计预处理

[大数据]数据预处理   1.字符串操作:解析身份证号:生日、性别、出生地等。      地址码: 表示编码对象常住户口所在县(市、旗、区)的行政区划代码。   出生日期码:表示编码对象出生的年、月、日,年、月、日代码之间不用分隔符,格式为YYYYMMDD,如19880328。   顺序码: 表示在同一地址码所标识的区域范围内,对同年、同月、同日出生的人编定的顺序号,顺序码的奇数分配给男性,偶数分
相关文章
相关标签/搜索