300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 大数据是什么?——读《大数据时代》有感

大数据是什么?——读《大数据时代》有感

时间:2020-01-26 17:23:58

相关推荐

大数据是什么?——读《大数据时代》有感

大数据(big data)这个词语,如今大量的被提及,但是你真的了解他的内涵吗?“大”这个字体现在哪里呢?给我们的生活带来了什么样的改变呢?

要不是偶然地机会接触到了《大数据时代》这本书,恐怕现在对它的理解还停留在字面的意思上。抛去对数理统计的抵触情绪,让我来说说大数据到底是啥。

首先,对于大数据概念,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征……

说完了,可是你还是一脸懵逼。

然而读了这个书之后,最大的感受是……仿佛从经典物理学走到了相对论和量子力学的维度,它背后的思维变革才是最有价值和值得深思的内容。

简单的说,它提出了三个重要的概念:

1、样本=总体

这话怎么讲?

首先,从小我接触的所有的教科书,都在统计学方面给我安上了一个巨大的思维回路,那就是随机样本!之后所有的统计分析方法都在这个基础上粉墨登场……这是一个很正确很严谨的科学脑回路,然而却在这个海量数据的时代成为了一个巨大的约束。以往的数据处理可能会受到计算机等的限制,可是现在计算机性能越来越好,我们却还封闭在自己画的那个圈里。事实上,数学头脑比较好的亲们会意识到,取样的合理性至关重要,而且现实问题可不比数学书里那些个孩子们平均身高体重的问题那么简单。因此,大数据提倡的就是,用所有的数据!不然你可能丢了很多关键信息!

2、接受数据的鱼龙混杂

如果你是个追求纯粹的分析师或者带有强迫症,你可能不太适应这样的观点。因为以往的经验都告诉我们对数据要进行处理,剔除一些错误,抛弃一些“无用的”数据,追求绝对的精确。

书中举了一个栗子,谷歌的翻译系统——它会吸收网络资源上所有能够找到的翻译,会从各种各样语言的公司网站上寻找对应文档,还会寻找联合国和欧盟发布的官方文件……目的就是为了吸收海量的信息,然后翻译更多且更可靠的内容。我们可以想到,它的输入源其实很混乱,也许它所吸收的带错误的翻译会另其他翻译系统抓狂,可是最终的结果却表明,谷歌翻译的质量却是最好的,而且灵活通用。

适当的放低标准,容忍误差或者错误的存在,反而提高了数据结果的可靠性。

3、“不求甚解”,相关关系才是王道

再一次的,我们需要放弃原有的固执的教条“知其然知其所以然”。事实上,在任何处理结果中追求因果关系并没有错误,只是……效率低的可怜。要知道沃尔玛超市并不需要理解为什么把蛋挞放在靠近飓风用品的位置边上可以获得销量的上升,他仅仅需要这个结果。同样的,在如今的商业竞争中,决策的效率至关重要,我无需知道内在的联系,我仅仅需要的是一个结果,帮助我更快地盈利。比如书中举了一个栗子:中英人寿保险有限公司,想要利用信息报告和顾客市场分析数据作为部分申请人血液和尿液分析的关联物,帮助找出更有可能有高血压、糖尿病和抑郁症的人。德勤咨询公司因此发明了预测模型,帮助保险公司省去了很大的投入,当然也免除了申请人许多的麻烦。

当然广义上讲,大数据的应用也有细思极恐的地方,在这个个人信息暴露的年代,也许通过分析你的购物习惯、出行习惯、交友范围、生活方式等等,可能你就会被定为潜在的不安定因素,也可能你心里最隐秘的想法也会一一起底……

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。