MapReduce之过滤(一)

MapReduce之过滤 模式描述 过滤作为一个抽象模式为其他模式服务,过滤简单的对每一条记录进行评估,并基于某个条件作出判断,以确定当前的这条记录是否保留。 目的 过滤掉不感兴趣的记录并将需要的记录保留下来 适用场景 使用过滤的唯一必要条件就是数据可以被解析为“记录”,并通过特定的准则判断他们是否可以被保留 近距离观察数据 跟踪某个事件的线索 数据清洗 简单随机抽样 移除低分值数据 问题描述 在
相关文章
相关标签/搜索