像数据科学家同样思考:12步指南(下)

第三-完成

一旦产品构建完成,你仍然须要作一些事情来使项目更加成功并使你的将来生活更轻松。那么咱们如何完成数据科学项目呢?数据库

10-交付

完成阶段的第一步是产品交付。为了建立能够交付给客户的有效产品,首先必须了解客户的观点。其次,你须要选择最佳的方式将项目成果反馈给客户。最后,你必须选择要包含在产品中的信息和结果以及要放弃的内容。在产品建立和交付过程当中作出好的选择能够大大提升项目的成功机会。编程

沟通媒介能够采起多种形式。在数据科学中,产品最重要的一个方面是客户是否积极参与产品而且可以使用产品来回答多种可能的问题。具体的沟通媒介有不少方式:数组

·       向客户提交结果多是最简单的选项,其中包括文本、表格、图表和其余信息,这些信息能够解决你的项目要回答的部分或所有问题。编程语言

·       在一些数据科学项目中,数据集的分析和结果也可用项目原始数据范围以外的数据,其中可能包括原始数据生成的数据、其余不一样来源的相似数据、或因为某种缘由还没有分析的其余数据。在这种状况下,若是你能够为客户建立能够执行分析新数据集并生成结果的分析工具,对客户有所帮助。同时客户能够有效地使用此分析工具,并继续在未来和各类(但相似的)数据集中回答他们的主要问题,这是最好的状况。工具

·       若是你想提供比分析工具更好的产品,你可能须要构建某种类型的完整的应用程。若是你正在考虑提供交互式图形应用程序,那么你必须设计,构建和部署它。一般,这些都不是一项小任务。若是你但愿应用程序具备许多功能而且具备灵活性,那么设计它并构建它将变得更加困难。学习

除了决定提供结果的媒介外,你还必须决定它将包含哪些结果。有些结果和内容多是包含的明显选择,但对于其余信息位,可能不那么明显。一般,你但愿包含尽量多的有用信息和尽量多的结果,但你但愿避免客户可能误解或误用你选择包含的结果。在许多状况下,这能够是微妙的平衡,而且它在很大程度上取决于具体项目以及客户和其余人对结果的知识和经验。spa

11-进行修订

产品交付后,咱们会在初步反馈后继续修改产品。一旦客户开始使用该产品,就有可能出现一系列全新的问题。尽管你付出了最大努力,但你可能没有预料到客户使用产品的方式的各个方面。即便产品完成了它应该作的事情,你的客户和用户也可能不会作这些事情而且有效地完成这些工做。设计

一般很难从客户、用户或其余任何人那里得到建设性的反馈。所以一些数据科学家提供完产品后就会忘记它们,一些数据科学家提供产品后会选择等待客户提供反馈。进行产品修订可能会很是棘手,找到合适的解决方案和实施策略取决于你遇到的问题类型以及你须要更改以解决问题的方法。若是在整个项目过程当中,你始终保持对不肯定性和许多可能结果的认识,那么你发现本身如今面临的结果与你以前预期的结果不一样可能就不足为奇了。可是,若是你一直勤奋,问题很小,修复相对容易。调试

一旦你发现产品出现问题并弄清楚如何修复产品,仍然须要决定是否修复产品。一些人最初的倾向是每一个问题都须要解决,这不必定是真的。若是有理由能够说服你不想进行修复问题,那就须要慎重考虑了,由于若是选择盲目地修复发现的每一个问题,那必定会花费大量的时间和精力。blog

12-结束项

数据科学过程的最后一步是将其包装起来。随着数据科学项目的结束,彷佛全部的工做都已完成,剩下的就是修复任何剩余的错误,而后才能彻底中止思考并继续下一个。但在完成项目调试以前,你能够采起一些措施来增长将来成功的机会,不管是扩展同一个项目仍是彻底不一样的项目。

如今有两种方法能够增长你将来成功的机会。一种方法是确保在未来的任什么时候候你均可以轻松地再次获取该项目并重作、扩展或修改它。经过这样作,你将增长在后续项目中得到成功的机会,因此,你须要从如今开始开始挖掘项目材料和代码并记下你用什么作的或者你是怎么作到的。最实用的方法是经过文档存储

提升将来项目成功率的第二种方法是尽量多地从这个项目中学习,并将这些知识带到每一个将来的项目中。经过进行项目分解,你能够从中梳理出有用的知识,这包括审查旧目标、旧计划、技术选择、团队协做等。是否能够应用于将来项目,经过项目回溯在过后进行思考,能够帮助发现有用的知识,使你可以以不一样的方式作事,并在下次更好。

不肯定性充斥在咱们每一个人工做的方方面面,记住过去给你带来问题的全部不肯定因素,能够防止相似的事情再次发生。从数据到分析再到项目目标,几乎任何事情均可能在短期内发生变化。了解全部可能性不只是一项艰巨的挑战,并且几乎是不可能的。良好的数据科学家和伟大的数据科学家之间的区别在于可以预见可能出现的问题并作好准备。

结论

数据科学仍然具备新领域的光环。它的大多数组成部分:统计学、软件开发、基于证据的问题解决等等,这些多是属于旧领域的知识,但数据科学彷佛是这些部分的新组合成新的东西。数据科学的核心并不关心特定的数据库实现或编程语言,即便这些对于从业者来讲是必不可少的,其核心应该是数据内容,给定项目的目标以及用于实现这些目标的数据分析方法之间的相互做用。

原文连接 本文为云栖社区原创内容,未经容许不得转载。

相关文章
相关标签/搜索