“大数据”这个词越来越频繁地出现在我们的生活中。我对这个词还没有清晰而直观的认识。因此,我打开了这本书,满怀求知和好奇之心。
在阅读这本书的引言部分时,我意识到我对“大数据”的认识过于狭隘。作者列举了一些关于大数据的应用,例如使用搜索引擎预测流感病例数,统计与预测机票价格的变化趋势等等。作者还把事物的物理性质在分子级别上的改变,以及绘画与电影,万有引力与表面张力等等相对应,用来说明同一事物不同规模对结果所产生的影响。因此,我明白了海量数据编织成的大数据的核心是预测。
随后,书的第一部分指出,过去由于难以收集大量数据,人们倾向于运用随机样本来分析数据,但随机采样的方法对于一些微观细节的信息较为误差较大。因此,人们开始更加重视大数据的混杂性。通过大量的数据统计,我们可以发现很多相关关系,这种相关性可以被运用在推荐算法,甚至在谷歌流感趋势中,计算机能够找出与流感传播最相关的词条。
在书的第二部分,作者告诉我们,万物都可以被数据化,数据的使用不再是使用完后就被删除,而是像神奇的钻石矿一样,有无限的价值和可能。根据所提供价值的不同来源,出现了三种不同种类的大数据公司。
在第三部分,作者指出,由于数据的价值潜力,互联网上大部分采集的数据都包含个人信息,这对我们的个人隐私构成了威胁。同时,过分依赖数据预测可能会导致盲目崇拜,并成为数据的奴隶。因此,作者建议数据使用者必须对这些数据承担责任,对计算机做出的决策进行回溯和寻找原因,并反对数据垄断等等。
在读完这本书后,我对大数据有了更多的认识。我了解到它可以用来干什么,它的神奇之处,以及在采集和使用数据时如何不侵犯隐私。同时,我也认识到在领略数据的魅力时,需要注意避免迷失在数据的王国中。
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价