从电商平台的「猜你喜欢」到音乐平台的「心动模式」,大数据已经渗透到了我们生活的每一个场景。不论是互联网行业,还是零售业、制造业等,各行各业都在依托互联网大数据(数据采集、数据存储、数据处理、数据挖掘、数据分析、数据呈现)实现企业价值。
那么,对于小白来说,如何进行数据分析呢?
首先,我们先来看一下数据分析的一般流程是怎样的?

数据分析流程
在数据分析过程中:
最关键的步骤:明确分析目的。
最耗时的步骤:数据清洗。
最难的步骤:建模分析。
通常,我们可以将数据分析比喻成做菜,做菜的过程其实就类似数据分析的过程:
1、明确分析目的——明确客人喜欢吃什么菜,爱吃辣还是爱吃甜。
如果搞不清报告阅读者的喜好,闭车造车,多半不会成功。
数据分析之后的一切工作都是围绕着这个目的来展开的,只有明确我们的分析目的,明确我们要解决什么问题,我们才能有针对性的去收集数据,解决问题。
在明确分析目的的基础上,我们尽可能多地搜集数据,为下一步提供数据源。
2、获取数据——获取食材。
不同的菜品需要不同的食材,不同的报告需要不同数据的支持。有些需要从系统中去导出,有些需要去网上收集,还有需要自行EXCEL表格收集。

找数据如同找食材
3、数据清洗——洗菜、切菜。
数据清洗是数据分析过程中最为繁琐和最耗时的一步,它几乎占用了数据分析的60%~80%的时间,一个优秀的数据分析工具可以帮助我们简化数据清洗的工作,让我们更加专注于产生价值的部分。
如果数据收集时就是规范的,则会节省大量的清洗时间,所以要把数据规范控制的关口前移,在产生数据前就控制规范。

从系统中也能获得“垃圾”数据
4、建模分析——炒菜、调味。
建模分析是最能考察一个数据分析师的分析能力的步骤,对待同一份数据,不同的分析师会有着不同的见解,得出的结果也不尽相同,这不仅需要我们积累业务经验提高对数字的敏感度,同时也需要我们提高对工具的熟练度。所以数据分析师要掌握各种分析方法,理论指导实践。

好工具,好方法搭配使用
5、数据可视化——调色。
数据可视化可以帮助我们更加直观、清楚的理解数据内在的含义,分析出其存在的规律,但我们需要遵循一条原则是:可视化的目的是让我们能更加容易的理解数据,因此,并不是越复杂的图形就越好。

图表是数据可视化的重要工具
6、发布报告——上菜。
当您得出了一份比较有价值的可视化报告,您就可以共享给组织或其他人,让数据产生其应有的真正价值。

PPT\EXCEL\WORD都是常见的呈现工具
好啦,想成为数据分析大师吗?别急,一步一步来慢慢学。