分析报告、统计分析与数据挖掘的区别(转)

 
“分析报告给你后见之明 (hindsight);统计分析给你先机 (foresight);数据挖掘给你洞察力 (insight)”举个例子说:你看到孙悟空跟二郎神打仗,而后写了个分析报告,说孙悟空在柔韧性上优点明显,二郎神在力气上出类拔萃,因此刚开始不相上下;结果两我的跑到竹林里,在竹子上面打,孙悟空的优点发挥出来,因此孙悟空赢了。这叫分析报告。孙悟空要跟二郎神打架了,有个赌徒找你预测。你作了个统计,发现两人斗争4567次,其中孙悟空赢3456次。另外,孙悟空×××魔王,胜率是89%,二郎神×××魔王胜率是71%。你得出趋势是孙悟空赢。由于你假设了此次胜利跟历史的关系,根据经验做了一个假设。这叫统计分析。你什么都没作,让计算机本身作关联分析,自动找到了出身、教育、经验、单身四个因素。得出结论是孙悟空赢。计算机经过分析发现贫苦出身的孩子通常比皇亲国戚功夫练得刻苦;打架经验丰富的人由于擅长利用环境而机会更多;在都遇获得明师的状况下,贫苦出身的孩子功夫可能会高些;单身的人功夫总比一样环境非单身的高。孙悟空遇到的名师不亚于二郎神,而打架经验绝对丰富,而且单身,因此此次打头,孙悟空赢。这叫数据挖掘。数据挖掘跟OLAP的区别在于它没有假设,让计算机找出这种背后的关系,而这种关系多是你所想获得的,也多是所想不到的。好比数据挖掘找出的结果发如今2亿条打斗记录中,姓孙的跟姓杨的打,老是姓孙的胜利,孙悟空姓孙,因此,悟空胜利。用在现实中,咱们举个例子来讲,作OLAP分析,咱们找找哪些人老是不及时向电信运营商缴钱,通常会分析收入低的人每每会缴费不及时。经过分析,发现不及时缴钱的穷人占71%。而数据挖掘则不一样,它本身去分析缘由。缘由多是,家住在五环之外的人,不及时缴钱。这些结论对推动工做有很深的价值,好比在五环外做市场调研,发现须要创建更多的合做渠道以方便缴费。这是数据挖掘的价值。
相关文章
相关标签/搜索