Data-Analysis-A-Skill-and-Industry

作为技能和行业的数据分析

Written by Huang, posted on September 4, 2021

在现代,认知这个世界几乎等同于认识数据。

前言

我在一个月前对于 中国数据库行业 进行了简单的探究,里面说明我对于数据库开发的一些想法。而现在, 我发现我并不喜欢那个行业,不过有一句话说得挺好:“爱好不是作为 工作而存在的。”——不过我认为我所预见到的并非是爱好,而是我的 使命:血脉中呼啸的教诲

于是,我选择将数据库开发作为一个备选项目,转而希望认识世界。 数据分析,顾名思义,就是从数据中获得信息帮助做出决定、解决问题 。数据大都由人产生,这些看似杂乱无章毫无规律的数据足以反映一个 人的至少一个侧面。

——这篇文章中,我希望简单用一个普通大学生的视角去阐述我对 数据分析的简单看法,会有许多谬误与自以为然的观点。

主体

Para 1

这里,我谈一下我对数据的看法。

我读过许多以数据为主体的幻想作品。那些颠扑不破的真理往往能够被 大众所认知,我想“数据是世界的真相”或许是其中一个。当然,我并非 阴谋论者,并不想去想象高维生物的想法。——毕竟,高维生物或许 根本就无法发现低维生物,我们不也没有发现过二维生物吗?

言归正传,在现代社会无论是对于人,还是对于行业,数据是至关重要的。 如果掌握了一个现代网民的所有网络活动的数据,我可以毫不讳言地声明: 我能够掌控这个人。当然,这是不被允许的。——不过,我们又怎么能够 想当然地认为这个世界上没有这种事情发生呢?

数据的本质是什么?信息——有价值的信息。0和1,一切都能够通过0和1 去表示,如果我们能够认识到【一切】的话。换言之,人类所能够认知的 几乎所有东西都能够通过数据去表示,只不过是所需要的技术难易与实现 不同罢了。当然,我们不是为了解【数据】而去了解【数据】,仅仅只是 为了做出更符合我们自身价值、想法、观念的决定而去了解【数据】。

从数据中透视出本质信息是困难的,利用现代计算机的算力、算法能够 做到从一堆毫无规律的数据中获取有价值的信息,进而做出更好的决定。

Para 2

作为行业的数据分析。

在我看来,数据分析并不能够称为是一个行业,因为它是无处不在的。 只不过因为软件、硬件、服务的需要催生出一些以此为生的企业和个人, 我就将它称作是一个行业。

——没有办法写下去,一个毫无从业经验的大学生去谈论整个行业, 这种行为是愚蠢的。

Para 3

作为技能的数据分析。

如今的数据分析并不是简单地用Excel做个表格,再用PowerPoint展现出来。 随着存储技术、索引技术与硬件的迅速发展,数据分析往往希望通过专业的 工具和大量的数据、算力去获得一个更为准确的结论和大量信息。—— 这是大数据技术。

当然,还有人工智能的发展。虽然从2011年的Siri问世到现在已经有10年时间 ,人工智能的发展并不如其他的互联网的技术那样迅猛。我认为主要是 人工智能是通过计算机模拟人的思维的技术,然而那些研究者却并不相信任何 非物质的东西,也就无法认识到思维是无法认知的。当然,研究者大都是 非常聪明的,他们通过许多奇思妙想,另辟蹊径,还是将思维导致的结果 模拟出来了。这种以结果作为驱使的AI可以做重复的、无需创造力的工作, 也就是简单的数据分析。——高端人才所做的数据分析具有决策功能。

我们应当认识到:今后无论是个人的重大决策,还是企业、国家的决策都 依赖于成熟、优秀的数据分析。所以,数据分析,即将/已然成为现代高端人才 甚至是所有人必备的技能。

当然,数据分析需要很强的概率和统计学知识、编程能力、建模组织能力、 业务领域的大量知识,还有数字敏感、洞察力、非同一般的思考能力。

后记

以前,我认为世界上一切都满足正态分布;现在虽然不这么想,我依旧认为 世界上的一切都满足统计学规律。统计学不是数学,是另一个认知世界的 手段。

曾经,我们受限于计算能力,微型、小型计算机已经能够处理许多数据; 如果还是不行的话,云计算也是一个选择;如果再不行的话,我们只能够 期待日后的量子计算机。所以,我能够认为:数据分析能够帮助我认识这个 物质世界