数据科学求职建议:掌握5种类型的数据科学项目

摘要:本文介绍数据科学求职应该掌握的五个相关项目,以便秋招者对应自身状况查漏补缺。面试

一年一度的秋招已经打响了发令枪,从去年的薪酬排行来看,算法工程师和数据分析等工做排在前列,不少相关专业的学生一直在自学一些网络上的公开课并阅读一些专业书籍,好比“西瓜书”、“花书”等,若是你如今仍然什么也没有准备的话,然而还想从事数据科学领域这个彷佛使人望而生畏的工做话,如今就要抓紧补补相关的知识了。在这里要提示一点,自我完善的知识不要局限于数据分析相关的知识,还要额外补充下相关领域的知识。另外,简历上展现我的技能的最佳方式是使用技能组合的形式,这样能让雇主相信你可使用你已经学习的技能。为了展现这些技能,如下是你应该着重补充的5种数据科学项目组合类型:算法

1.数据清理编程

数据科学家预计在一个新项目的清理数据处理上花费多达80%的时间,这对于团队来讲是一个巨大的代价。若是你能够证实你在数据清理方面经验丰富,那么你将当即变得更有价值。练习这项能力的方法是建立一个数据清理项目,找到一些混乱的数据集并开始进行清理。网络

图片描述

若是你使用Python语言进行编程,那么Pandas是一个很好用的库,若是你使用R语言编程,那么你可使用dplyr数据包。你实践的数据清洗项目应该确保展现如下技能:机器学习

  • 导入数据
  • 加入多个数据集
  • 检测缺失值
  • 检测异常
  • 输入缺失的值
  • 数据质量保证

2.探索性数据分析工具

数据科学的另外一个重要方面是探索性数据分析(EDA),这是一个生成问题并用可视化方法对其进行调查的过程。 EDA容许分析人员从数据中得出结论来推进业务影响,它可能包括基于客户细分的有趣洞察,或基于季节效应的销售趋势。一般你能够经过探索性数据分析来获得一些有趣的发现。布局

图片描述

用于探索性分析的一些有用的Python库有Pandas和Matplotlib。对于R用户而言,ggplot2软件包将会颇有用。你实践的EDA项目应该显示如下技能:学习

  • 可以制定相关的调查问题
  • 识别趋势
  • 识别变量之间的协变
  • 使用可视化有效地传达结果(散点图,直方图,饼图等)

3.交互式数据可视化测试

交互式数据可视化包括诸如仪表板之类的工具,这些工具对于数据科学团队以及更多面向业务的最终用户都是颇有用的。仪表盘容许数据科学团队进行协做并共同绘制看法。更重要的是,它们为面向商业的客户提供了交互式工具,这些人专一于战略目标而不是技术细节。数据科学项目的交付成果每每以仪表板的形式出现。网站

图片描述

对于Python用户而言,Bokeh和Plotly库是很是适合用来建立仪表板的。而对于R用户,可使用RStudio的Shiny软件包。你实践的仪表板项目应该强调这些重要技能:

  • 包括与客户需求相关的指标
  • 建立有用的功能逻辑布局(易于扫描的“F模式”)
  • 建立最佳刷新率
  • 生成报告或其余自动操做

4.机器学习

机器学习项目是数据科学产品组合的另外一个重要组成部分。如今,在开始进行一些深度学习项目以前,请保持耐心。不要一开始就构建复杂的机器学习模型,而要坚持从基础知识开始学起。线性回归和逻辑回归是很好的开始,这些模型更容易解释并能清晰地与上层管理人员沟通。此外,我还建议专一于具备业务影响的项目,例如预测客户流失,欺诈检测或贷款违约等,这些比预测花型更实用。

图片描述

若是你是Python用户,请使用Scikit-Learn学习库。而对于R用户,请使用Caret软件包。你实践的机器学习项目应该传达如下技能:

  • 选择使用某个具体机器学习模型的缘由
  • 将数据分红训练/测试集(k-fold交叉验证)以免过分拟合
  • 选择正确的评估指标(AUC、adj-R ^ 二、混淆矩阵等)
  • 特征工程和选择
  • 超参数调整

5.沟通

沟通是数据科学的一个重要方面,对于工科人员而言这点尤为欠缺。可以有效地传达结果是区分优秀的数据科学家与伟大的数据科学家的重要衡量标准之一。不管你的模型多么华丽,若是你不能向队友或顾客解释它,你都不会获得他们的支持,就如同对牛弹琴通常。幻灯片和Notebook都是很好的沟通工具,能够将你的机器学习项目按照项目过程以PPT的形式展现,也可使用Jupyter Notebook或RMarkdown文件进行沟通。

图片描述

确保了解你的目标受众是谁,向高管呈现的内容与向机器学习专家呈现的内容两者是彻底不一样的。确保具有这些技能:

  • 了解目标受众
  • 提供相关的可视化
  • 幻灯片不要写太多的内容
  • 确保演示文稿流畅
  • 将结果与业务影响联系起来(下降成本,增长收入)

确保在Jupyter笔记本或RMarkdown文件中记录本身的项目。而后,也可使用Github 免费将这些Markdown文件转换为静态网站。这是向潜在雇主展现我的技能组合的好方法,即GitHub主页或CSDN博客等。

最后,在求职的道路上请保持积极的态度,做为应届生,不要被一次次面试、笔试所扰乱心态,请保持继续补充知识、练习项目并参加一些竞赛等。不要慌张,秋招过去,还有春招,春招过去还有社招,只要你一直努力提高本身,相信最终会有好的结果等着你,但愿你可以快乐求职,而且在数据科学领域工做顺心。

文章原标题《5 Data Science Projects That Will Get You Hired in 2018》

原文连接

本文为云栖社区原创内容,未经容许不得转载。

相关文章
相关标签/搜索