在学习数据分析之前,首先需要明确两个问题:

  1. 数据分析有什么用?

  这个问题帮助你明确学习目的,你为什么要学数据分析?想用数据分析做什么?如果这是课程要求你不得不学习,明确用途也会对你的职业选择等有所帮助。

  2. 数据分析的知识框架是什么?

  如果你已经决定要学习,了解知识框架有助于在你脑海中构建体系化结构。如果知识好比建筑工程中的材料,知识框架就是图纸,依据图纸就能通过原材料搭建出高楼大厦。

  数据分析的作用

  我们先来看三个例子:

  1. 假如你刚刚接手了一个微信公众号,想要了解粉丝的阅读倾向,通过后台的阅读量等统计数据,你发现凡是标题中带有「女子深夜」这个关键词的图文阅读量都普遍高于平均值。

  2. 我的一个学长,想要更多了解心仪的女孩,在获知女孩的网易云音乐账号后,通过爬虫抓取了女孩的兴趣歌单,并发现「民谣」所占的比例最高,因此他推断女孩最爱听民谣音乐。

  3. 世界杯期间,许多人投注德国队,与之相对的是,几乎所有使用人工智能预测结果的公司都认为德国将会出局。

  你可能已经发现了,数据分析就是利用已知数据得出结论。但上面三个例子又稍微有些不同。

11.png 数据分析入门:数据分析有什么用?该怎么做? 人工智能知识大全_AI知识

在第一个例子中,你通过已有数据发现了一个结论,这个结论具有描述性质,你只是将一个不易被发现的现实描述了出来。

  你也许认为第二个例子也是一种描述,毕竟女孩歌单中「民谣」歌曲最多。但是一个隐藏的事实是,几乎没有人仅仅用一个音乐软件听音乐。在商场听到的某一首歌也许值得被加到歌单里;一些网易云音乐没有版权的歌曲也许女孩很喜欢。网易云音乐的歌单,实际只是女孩听的所有音乐的一个部分。学长通过这个部分推断出了结论。

  第三个例子则显而易见,通过已知数据,预测未知结果。天气预报也是这么干的。

  所以数据分析就是通过分析处理数据,得到问题的解答(或某个结论)。这个结论可以是一种描述,也可以是一个推断或者预测。具体如何实现,要根据我们的想要解决的问题来决定。

  数据分析的知识框架

  数学

  上面的三个例子分别对应了不同的数学知识。

  要描述一个现象,我们最常用的数学工具是描述统计学(Descriptive Statistics)。

  要做出一种推断,需要应用推论统计学(Inferential Statistics)。

  以上两个都属于统计学范畴,涉及到预测,就需要使用到概率论(Probability Theory)的知识以及机器学习中经常使用到的线性代数(Linear Algebra)。

  别怕,以上四个知识都不难。(如果现在觉得难也可以放弃,可能数据分析对你意义不大)

  工具

  除了一定的数学知识以外,你还需要一些工具来帮你搜集整理数据和进行可视化表达。形式可就多种多样了,就搜集数据来说,你可以用网络 API 获取数据,也可以通过爬虫爬取数据,当然在公司里,使用 SQL 查询公司数据库内的数据也是很可能的。整理数据你可以使用 Excel,Google Doc 等工具或 Python 之类的绝大多数编程语言。说到可视化表达,PPT 能做吧?PS&AI 能做吧?Excel 也能做吧?网页能做吧?Python 也能做(而且做的也很优秀)。

  所以工具真的不在于你掌握了多少,而在于你是否能精通。但是有一个工具很重要,是你求职必备也是你工作中一定会用到的,就是 Python。

  为什么偏偏是 Python?抛去历史原因,你可以简单的理解为,从获取数据到可视化,使用一个 Python 就能较快的完成全部工作,提高效率和容错率,是一个非常好的工具。

  在今后一系列的视频/文章当中,我也会重点介绍 Python。(其他一些工具也会涉及)