数据分析入门如何做?这些知识不得不看
很多人在入门数据分析的时候都无从下手,很多时候都是因为基础知识掌握不牢,连数据分析的目的都没搞清楚,怎么会成功呢?其实想要学习数据分析,也需要抖点机灵!
比如,某电商双十一跟着淘宝做了一个大促活动,事后想了解活动的效果,于是找到了小王。
于是,小王开始收集数据、处理数据、建立模型、制作报表。最终得出结论:活动期间UV上涨了50%,订单增长了40%,销售额提高了45%云云。
这叫数据分析吗?当然不,因为小王根本没有找到数据分析的目的,只是单纯的统计数据而已。没有目的,自然也就不会有结论,而这两者是数据分析最关键的两点。
总结来看,数据分析的目的是整个研究方案的起点,决定着后续研究的内容,数据的来源,使用的方法,其目的无非就是两个:
分析现状和过去——有问题了,通过数据分析寻找原因,制定决策
预测未来——有新项目、产品、方案要上线,或企业制定大决断,需要数据分析结论做辅助参考
数据分析的步骤1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题,提供清晰的指引方向。
2、数据采集。收集原始数据,数据来源可能是丰富多样的,一般有数据库、互联网、市场调查等。具体办法可以通过加入“埋点”代码,或者使用第三方的数据统计工具。
3、数据处理。对收集到的原始数据进行数据加工,主要包括数据清洗、数据分组、数据检索、数据抽取等处理方法。
4、数据探索。通过探索式分析检验假设值的形成方式,在数据之中发现新的特征,对整个数据集有个全面认识,以便后续选择何种分析策略。
5、分析数据。数据整理完毕,就要对数据进行综合分析和相关分析,需要对产品、业务、技术等了如指掌才行,常常用到分类、聚合等数据挖掘算法。Excel是最简单的数据分析工具,专业数据分析工具有FineBI、Python等。
6、得到可视化结果。借助可视化数据,能有效直观地表述想要呈现的信息、观点和建议,比如金字塔图、矩阵图、漏斗图、帕累托图等,同时也可以使用报告等形式与他人交流。
怎么做数据分析简单来说,数据分析的本质还是分析,就是一个发现问题-分析问题-解决问题的过程。
首先要说的是,数据分析不光是一个技术门类,同时它也是一个庞杂无比的理论门类,里面包含了大数据、机器学习、统计学等等诸多领域的知识,很多刚接触数据分析的人都不知道该从何学起,其实无外乎三个字——道、法、器。
1、道:这里指的是业务思想,千万不要以为数据分析就是取数、用数,你首先要学的不是什么编程语言或者分析工具,而是和建立业务分析体系相关的管理、营销知识。一句话,没有业务思想,你就算是学会了所有编程语言,也成为不了数据分析师。这一点是对于完全外行的人来说的,建议先读一本《商务与经济统计》。
2、法:自然就是方法,这里主要是指数据分析方法,比如杜邦分析法、漏斗分析法、四象限分析法等等,这些都是入门数据运营所必备的知识。这方面建议新手读一本《谁说菜鸟不会数据分析》
3、器:业务思想有了,分析方法也学会了,下面就可以学习数据运营用到的各种工具了。
数据库:企业比较常用的大型数据库有Oracle 、db2 、sql server 、Sybase、Mysql,这么多数据库不用都会,只要学会掌握其中一两种就行了,新手的话建议学习sql。
Excel:先别急着惊讶,Excel绝对是数据运营工作当中必须要掌握的工具!想要精通Excel也绝对不是你想象的那么简单,起码要学会Excel里的各种进阶操作,比如透视表,再高级一点的函数可以等你入门后再学习。
Python/R语言:作为偏向于数据分析的编程语言,R与Python其实都是差不多的,但是就学习难易上讲我还是推荐Python,因为Python几乎可以说是市面上最简洁、最强大、最成功的编程语言了,标准的全能语言。
数据分析工具、可视化工具:剩下这些工具就是按照你所选择的方向进行学习了,主要由下面几个类别:
图表类插件:ECharts、Highcharts等功能都十分强大。
数据报表类:FineReport等,对于日常的报表制作,更加易学实用。
可视化BI类:比如FineBI、cognos、tableau等,更直接地针对业务分析。
数据分析常用方法1、PEST分析:
是利用环境扫描分析总体环境中的政治、经济、社会与科技等四种因素的一种模型。这也是在作市场研究时,外部分析的一部分,能给予公司一个针对总体环境中不同因素的概述。这个策略工具也能有效的了解市场的成长或衰退、企业所处的情况、潜力与营运方向。一般用于宏观分析。
2、SWOT分析:
又称优劣分析法或道斯矩阵,是一种企业竞争态势分析方法,是市场营销的基础分析方法之一,通过评价自身的优势、劣势、外部竞争上的机会和威胁,用以在制定发展战略前对自身进行深入全面的分析以及竞争优势的定位。
3、5W2H分析:
用五个以W开头的英语单词和两个以H开头的英语单词进行设问,发现解决问题的线索,寻找发明思路,进行设计构思,从而搞出新的发明项目具体:
WHAT:是什么?目的是什么?做什么工作?
WHY:为什么要做?可不可以不做?有没有替代方案?
WHO:谁?由谁来做?
WHEN:何时?什么时间做?什么时机最适宜?
WHERE:何处?在哪里做?
HOW :怎么做?如何提高效率?如何实施?方法是什么?
HOW MUCH:多少?做到什么程度?数量如何?
4、7C罗盘模型:
7C模型包括
C1——竞争对手;C2——商品;C3——成本;C4——流通渠道;C5——交流;
C6——消费者
N = 需求:生活必需品,像水、衣服、鞋。
W = 想法:想得到的东西,像运动饮料、旅游鞋。
S = 安全:安全性,像核电、车、食品等物品的安全。
E = 教育:对消费者进行教育
C7——环境
N = 国内和国际
W = 天气
S = 社会和文化
E = 经济
5、海盗指标法AARRR
是互联网常用的“用户增长模型”,黑客增长模型:
Acquisition:获取用户
Activation:提高活跃度
Retention:提高留存率