数据分析师
当下最火的互联网职位,不少求职报告显示
数据相关工作已经是互联网公司内部最为高薪的岗位之一
例如:
国际人19届应届生薪资报告显示
✨ 数据分析及算法类岗位的平均应届生就业薪水是250000
✨ 互联网产品经理是192640
✨ 运营是142000
本篇文章就跟大家聊聊什么是数据分析师,如何成为数据分析师。
一、SQL/Python是基础,统计学知识应用是关键
数据分析工作流程可分为:数据获取、储存提取、预处理、建模与分析、可视化这五个流程,每个流程需要的知识技能在下图已经标出。
总结:想成为数据分析师,你需要掌握
1 | Python基础和爬虫; |
2 | SQL语言; |
3 | 回归分析; |
4 | Python科学计算包:pandas, numpy, scipy, scikit-learn; |
5 | 统计学基础(独立事件,贝叶斯,置信区间等基本概念); |
6 | 数据可视化工具seaborn和matplotlib; |
7 | 高级的数据分析师必须要懂得数据挖掘的基本算法例如分类聚类和特征提取。 |
2、 数据分析必须以业务驱动为根本目的
百度百科定义:
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
数据分析拆成两个词
数据 & 分析
数据的关键点在于如何低成本获得更精确,更及时,更多维度的数据;
分析的关键点在于如何让这些数据通过处理加工产生价值。
而对企业来说:
只有对其实际业务经营有帮助的行为才可以产生价值,数据分析的好不好有没有用,就在于其分析出的结论能否作为企业管理者为其业务经营做下一步行动规划的依据。
也就是说:即便你学会了python和sql并不代表你能够做好数据分析的岗位,你必须要对企业的经营业务有独特的观察视角才能够让你手中的数据发挥价值。
例如:啤酒与尿布的故事
20世纪90年代的沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象一般出现在年轻的父亲身上。
在美国有婴儿的家庭中,年轻的父亲前去超市在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域甚至打包成套餐,从而获得了很好的商品销售收入。
这个故事里如果数据分析人员只看到了啤酒和尿片的销量关联但并没有找出奶爸的行为是其根源,就不会让这些数据产生价值,从而提升沃尔玛的销售收入。
所以,数据分析师需要数学统计专业学到概率统计的知识,也需要计算机专业学到的python,更需要市场营销企业管理专业看待企业业务经营的独特视角。所以这是一个需要多种领域技能的岗位,没有人是专业对口的。
三、 面试知识点罗列
数据分析岗位面试考察的知识点主要有三大类,
1, 工具使用:excel,python,sql三大最基本工具的各项功能应用。
Excel 必须掌握vlookup,透视表,各种常见函数的应用和图标制作,最经常问到的问题是,你在以前的实习中做过什么报表。
Python 一般会考核基本语法和数据分析包(numpy, pandas和matplotlib)的应用,能够使用python操作结构化数据,做数据清洗,抽取和可视化。这些问题随便找一本python的入门书籍都可以学到。
SQL 基本要求有会利用开源数据库MySQL进行查询,会分组,聚合和排序。在网上有很多SQL面试题笔试题合集,大家需要可以自行查阅。
当然基础的工具还有SPSS,其实会用Excel想学SPSS分分钟的事儿,就不多介绍了。
2, 理论知识:就是上面提到的统计概率基本知识,如果你会机器学习会加分。
面试官在面试中会直接问置信区间是更怕I型错误还是II型错误这种考察概念的问题。
机器学习的基本算法类如逻辑回归,贝叶斯,决策树,随机森林,线性回归,K-means等在大多数基础数分岗位不是必须项,但掌握的越多越加分。
3, 业务知识是最大头:如果对算法和数据分析的思维有很深的理解,能把其和业务需求实际结合起来,只用excel就能做绝大多数的数据分析。
常用的分析思维比如漏斗思维,分类思维,平衡思维,金字塔原理,ABtest等,多看一些案例。
面试官会经常问,我们公司接下来要新推出一款app,为了xx目的你会监测哪些运营指标,或者直接拿现在的运营数据让你直接分析,并说出有价值的结论。
最后关于面试的细节要提醒大家,不同的公司业务部门以及不同的面试官关注的点是不一样的。
例如:
数学统计学专业出身的面试官会着重与统计概率和建模的能力;
计算机专业出身或者之前做过产品运营职位的面试官会更看重SQL,Python甚至Hive等工具的使用。
被问到到不懂的知识点不要慌,上文说过这个岗位没人是专业对口的,包括面试官都是转行来干这个,你只要表达出自己快速学习能力即可。