大数据项目——互联网精准营销——数据清洗

使用kettle进行数据清洗:html  1.新建转换去除手机销售信息表的重复记录   要求:去除该字段中的全部空格,方便后续聚合统计,字母统一大小写,去除该字段中的全部特殊字符(各类标点符号) 正则表达式       这里可选用排序加去重组件,也可用哈希去重。而后用字符串操做去括号,大小写统一。字符串替换的正则表达式去除特殊字符。post            2.新建转换去除用户评论信息表的重
相关文章
相关标签/搜索