做者 | Bob Violino
编译 | 中国统计网
对于IT来讲,夸大其功效的炒做越多,外界对其的误解也会越大,数据分析固然也不例外。数据分析是当今信息技术最热门的领域之一,能够为企业带来显著的业务收益,但这些误解可能将妨碍分析过程的及时、顺利交付,并影响业务用户和最终客户。算法
随着企业建立或扩展其分析策略,这里有12个他们须要格外注意的关于数据分析的误解。小程序
现在,彷佛对每一项新技术的投入都必须经过严格的财务支出的筛选过程。“它须要多少费用?”——是IT和业务经理在提议启动项目或部署新工具时须要首先考虑的问题之一。安全
有些人认为数据分析本质上是一项代价高昂的工做,所以仅限于拥有大量预算或大量内部资源的企业机构。可是事实并不是如此,如今市场上有不少开源工具和其余工具可以帮助展现数据分析的价值;而且基于云系统的大数据架构,也会比传统的数据仓库便宜得多。你只须要明确内部数据存储以及要解决的问题,就能够轻松的在云上使用分析来解决业务问题。架构
此外,数据分析一般用于实现三个结果:提升流程效率、实现收入增加和主动进行风险管理,总的来讲,数据分析在任何公司的应用中都带来了巨大的成本效益。机器学习
对于许多人来讲,大数据和分析的概念是相辅相成的,企业须要在执行分析以前收集大量数据,以便生成业务洞察,改进决策制定等。工具
固然,大数据分析的优点也很明确,拥有这些资源的公司利用大数据存储做为促进分析工做的一部分,得到了显着的竞争优点。可是大数据却并非分析必不可少的搭配。学习
分析师须要特定的数据,而不是更多的数据。要想更好地支持决策和提升绩效,企业必须更多的考虑业务用户,肯定他们须要访问哪些数据,如何呈现数据,而不是关注更多的数据。95%以上的用户会寻找和他们工做相关的信息来支持他们进行决策,来提升业务表现,因此企业须要以最简单的格式向他们提供这些信息,帮助他们快速定位重要信息。大数据
自动化系统执行的方式不该该存在偏见,但技术是由人类创建的,所以消除全部偏见几乎是不可能的。人工智能
有些人认为分析和机器学习消除了人类的偏见,不幸的是,这并无实现。算法和分析使用“训练数据”进行调整,并将重现“训练数据”所具备的任何特征,在某些状况下,这会在分析过程当中引入良性偏见,但也有可能带来更严重的偏见——由于“算法这么说”并不意味着答案是公平的或者有用的。spa
事实证实,有了足够的数据,有时算法可有可无。谷歌的工程师认为,数据有着不合理有效性 ,简单的统计模型,加上极大量的数据,比包含大量特征和总结的“智能优越模型”能输出更优质的结果。
所以,在某些状况下,只需处理更大量的数据就能够得到最佳效果。
人们执拗地信任统计模型和算法,而且随着分析程序的组织构建,他们会愈来愈依赖复杂的模型来支持决策。这或许是由于用户并不以为他们有能力挑战模型,所以他们必须相信构建它们的“聪明人”。
好比,在过去的50到60年里,咱们反复听到“人工智能将在20年内接管人类工做”的言论,如今也仍是有人反复强调这种观点。在咱们能够彻底信任机器学习和它们输出的结果以前,还有不少事情要作。在那以前,咱们须要挑战构建算法和模型的人,让他们解释如何获得答案。这并非说咱们不能依赖于结果,而是说咱们须要透明度,这样咱们才能够信任和验证分析结果。
近年来,数据科学学科受到了不少关注,有时甚至会与其余学科产生混淆。基本上来讲,数据科学涉及了数据查找模式中全部算法的使用。
数据科学彷佛很神秘,由于这些算法可以分析比人类可以理解的范围内更多变量和更大的数据集。可是随着近年来计算能力和内存的扩大,咱们如今可以快速解决10年前任何技术都没法解决的问题,人们也随之明白,数据科学是统计推断技术的天然演变。但一旦你理解了数学,数据科学就没有了神秘感。
现在,数据科学家是全部技术专业人员中最紧缺的。但若是他们从新定位他们正在进行的工做,组织机构可能会减小这些专业人员的数量。
许多数据科学家的时间花费在非增值活动上,好比查找数据集,将数据发送到能够处理的地方,以及转换和清理数据等。考虑到聘请数据科学家的困难程度,这些低价值的任务并非企业想要的。
数据科学家须要专一于特征工程,提取和分析,而不是围着数据打转,这样才能大大提升他们的工做效率和产出。
现在,快速完成工做——不管是将产品或服务推向市场,仍是近乎实时地响应客户咨询,对于任何企业来讲都是影响核心竞争力的重要因素。
分析听起来彷佛须要很长时间才能执行,与实现速度和敏捷性的目标背道而驰,但这仍然是一个误区。归根究底,一切都与人才有关。有了正确的技能组合和敏捷方法论的应用,大型问题也能够在几天或几周内获得回答,而不是几个月。
随着当今可用技术的不断增长,选择合适的工具组合进行部署和集成,能够
更好从分析团队得到所需的结果,
然而,真正困难的部分是“整合组织结构和运营模式,将人员、流程、技术视角所需的所有内容整合在一块儿。假如你认为只有技术才能解决任何商业问题,那么在此认知之上创建的数据架构,最终会将企业带入“沼泽地”中,或者是产出任何人都难以理解的信息。
技术没法解决分析问题,正确的流程是:先肯定一个业务问题,而后问,“我须要什么数据来解决这个问题?”这将帮有效帮助您识别企业内数据的差距。
在一些组织中,数据分析被划入一个单独的部门,而另外一些组织则将数据分析深深地融入了跨职能团队。
然而事实证实,以全部业务领域的数据爆炸和变化发生的速度,以单独部门存在的数据分析开始不起做用了。另外一方面,随着企业变得更加以客户为中心,应该让数据分析专家成为业务部门的核心,而不是将其独立于做为业务支持的部门。
当今企业面临的许多复杂问题都存在于业务部门内,并且这些问题的许多解决方案都隐藏在数据中。数据科学家和技术专家,与这些业务部门密切合做,使用大型数据集和人工智能,将成为孵化下一代产品、服务和客户体验的关键。
很高兴咱们在分析团队中拥有了许多受过良好教育的人,但这并非分析成功的必要条件。
企业倾向于认为,若是数据分析师没有博士学位,他们将没法进行最佳的分析。然而现代分析须要各类技能——创建具备不一样技能的“分离舱”,包括那些精通新兴技术和开源软件的人、大数据架构师、数据工程师、数据科学家、数据可视化专家等等,才是最重要的。
历史上新技术的引入扰乱了许多工做和行业,人们一样担忧人工智能会消除人们执行某些任务的必要。
虽然AI解决方案比解决某些问题的人要好得多,好比AI能够更快地阅读,记住更多,而且比任何人都能更好地进行复杂数学关系的计算。可是,AI也没法应对真正全新的变化,这是人类擅长的地方。
能够确定的是,某些工做已经因AI的兴起而消失或减小,与此同时这种趋势还在增加。尽管如此,咱们理解和解决“彻底不可预见的状况”的优点不会被任何目前的AI技术所取代。在可预见的将来,最有效的方法是经过AI系统来加强人类的能力,取代人工的“繁重”。虽然人工智能正致使许多工做岗位发生变化,可是人们会将成为这一商业生态系统的重要组成部分。
扫码进入CDA官方小程序,解锁更多新鲜资讯和优质内容,还有免费试听课程,不要错过哟!