面试过一些人,也被人面试过,今天我来谈谈对数据分析岗位面试准备的理解,特别是互联网行业面试考察的主要方面,以及如何快速准备。注意,面试准备大致上仅针对面试,并不会涵盖数据分析全方面的知识体系,特此建议初学者通过系统化学习后,再进行相关面试准备。python
在你们开始找工做以前,至少留出2周时间进行知识梳理及过往经验总结,系统化处理碎片信息。面试准备时间过长的话容易致使疲惫,太短则可能准备不充分,你们必定要按照本身的实际状况进行安排。注意,本篇仅适用于0-5年数据分析师哦。如下分几个方面来说讲数据分析的面试准备。面试
1、统计学算法
统计学基础对于数据分析师来讲很是重要,寻找指标之间的相关性、设计ab测试、显著性检验、结果分析、预测建模等都须要必定的统计学知识,因此建议复习高频知识点。sql
高频考点:编程
一、统计推断:置信区间、假设检验(t检验、z检验、卡方检验),几种检验方法的差别性及适用条线、p值的概念、检验样本选取、统计量等概念,参考《一篇搞懂假设检验》框架
二、几种经常使用几率分布(二项分布、泊松分布、正态分布和指数分布等)ide
三、大数定律、中心极限定理等函数
四、几率与抽样学习
五、异常值检测、归一化标准化等测试
六、常见统计分析模型:相关分析、回归分析、方差分析、因子分析等
推荐复习资料:《白话统计学》《商务与经济统计》
2、编程能力类:sql+python
互联网数据分析师岗位编码能力考察一般是sql+python,R语言较少考察。对于分析师来讲,sql是一切分析工做的基础。Sql的考察形式通常为当场出1-2道场景题目。而Python在业务类分析师的面试中一般不会考到。
高频考点:
一、sql开窗函数:函数名(列名)OVER(partition by 列名 order by列名)、row_number、rank、dense_rank三个函数排序的区别
二、表关联:left join 、right join、join
三、having、where
四、数据倾斜问题如何优化
五、Python:循环、字典、字符串等
推荐复习资料:不推荐《sql必知必会》这本书,推荐你们直接在网上搜题目来练习,例如在牛客网sql刷题。
3、项目经历类
项目是数据分析岗位考察的重点,是最能考察候选人对业务的熟悉程度、思考深度、思惟方式以及对本身工做的梳理总结的一个环节,可能面试中60%的时间都在聊项目。准备面试的时候最好完整梳理至少两个过往所作的项目,项目选取尽可能选择完整性高、参与度深、成果好的。我认为须要重点梳理如下几个点:
一、项目背景、规模、涉及人数部门、项目角色(owner、参与者)
二、行动计划、抓手
三、过程当中的效果衡量指标
四、项目中遇到的困难及如何解决
五、项目后续是否有迭代优化,基于什么考虑
六、项目作完后具体带来的价值,解决了什么问题(尽可能量化指标)
七、项目结束后的反思,方法论沉淀
八、数据分析能力在这个项目中的体现
建议你们将本身的项目按以上几个维度去梳理,在面试的时候不要将以上几点一气说出,例如四、五、7比较适合留给面试官来进行项目深挖提问。在叙述中,注重逻辑性及条理性,清晰表达,着重体现本身的分析能力和最后取得的成果。
一些小伙伴的工做比较琐碎,没有经历过比较完总体系化的分析项目,那么能够着重梳理本身工做中的重点产出,解决过什么问题,将本身在过程当中的思考方式进行总结,毕竟分析师最核心的能力不只是‘分析’,还有‘把事儿作成’,因此照着这个方针,去说说你是如何解决问题,把事儿作成的。
4、分析思惟
分析思惟指的是数据分析经常使用方法论,比较常见且重要的分析方法和场景有:漏斗分析、分类分析、用户路径分析、A/B实验、roi分析、ltv分析、分层分析、流失分析、留存分析等。一般面试不会直接问分析方法论,而是会出一些开放性问题去考察应试者的分析思惟。
高频考点:
一、指标异常波动分析
参考《dau日活降低,我该如何分析》这篇文章,核心要点:1)确认数据异常真实性,排除bug、数据统计问题等影响 2)先沟通,确立几个核心异常假设,再进行数据验证3)列出公式,多维度层层拆解下钻,计算影响系数,定位问题
二、ab实验
依据所面试的产品状况和岗位jd能够推断面试是否会考察ab实验的知识,一般强依赖推荐算法、策略的产品驱动的公司考察可能性会很高,例如:探探、头条、腾讯等公司。参考《AB实验你要知道的都在这里》。ab实验核心如下几个基础知识点:
1)ab实验的背后统计学原理,即假设检验、中心极限定理等
2)如何肯定实验样本量:根据指标的base值和两组指标的差别、指标方差、检验的显著性水平(默认0.05)、统计功效(默认80%)等几个维度指标来肯定实验样本量。
3)先经过低代价小流量的实验,逐渐推广到大流量用户。不一样版本不一样方案在验证时,要保证其余条件一致
4)分组确保用户特征均匀,如须要可采用分层抽样。如实验交叉,可采用正交分层的方法排除实验间的影响。
三、数据指标、监控体系
指标体系是几乎每家公司每一个产品都会作的,是一切分析工做的基础。面试时考察到指标、监控体系搭建的可能性很是高。参考《数据指标体系搭建流程》这篇文章,核心要点1)梳理业务流程 2)收集需求、根据指标框架进行拆分,肯定统计维度粒度 3)整理底层储存逻辑、可行性输出
推荐复习资料:分析思惟不是一朝一夕能够日新月异的,须要平常的积累。但可在面试前看一些总结性的文章、书籍,例如《精益数据分析》、小洛的公众号(小洛公众号上面的文章基本都是属于分析思惟、分析方法论这方面的干货)
6、针对面试岗位的特定准备
作面试准备不只须要总结本身过去经验,且须要根据面试公司、产品、分析方向的不一样,来进行一些针对性的准备。须要了解该业务的产品逻辑、商业模式、经常使用数据指标以及该业务类型的经常使用分析方法。例如面试增加数据分析师,须要了解经常使用的增加策略和增加模型,渠道拉新roi ltv、用户画像、ab实验等分析方法。在面试的时候,能够谈谈本身对该业务的了解,本身的过往经验能够帮对方解决什么问题,若是入职能够从哪方面来开展工做等方面,向面试官展现本身对该职位的诚意和匹配度。
本篇所提到的知识点确定不会涵盖全部面试考察点,可是只要提到,都是重中之重。但愿能够给想要看机会,可是对如何准备缺少头绪的你们提供一些复习思路。
最后,欢迎你们关注个人公众号,祝你们面试顺利!