大幕初开的大数据时代

2025-02-06 14:14:00

数据正在以前所未有的速度呈现出爆炸式增长。随着各类电子终端设备的普及,社交媒体、电子竞技和电子支付等网络服务愈加丰富,再加上智能手机和可穿戴设备的助力,一个人在哪里、做什么,甚至连身体的轻微变化,都被一一记录和分析着。

在大数据时代,人们对于事物的认知,正在从管中窥豹变成洞若观火,因为全量数据能帮助人们最大程度上接近真相。石化产品的研究本质是分子排列的创新组合和重构,在传统的石化企业,新产品的研发依赖研发人员的学识和经验,企业要承担这样的风险:研发人员提出的200个可能性组合,经过漫长的实验,可能颗粒无收。在大数据搭配人工智能的黄金时代,通过构建由分子属性、反应规则等非结构化数据组成的全量知识库,运用机器学习联动全量知识库就能探索几乎所有可行的分子组合,进而在若干个可能方案中诞生出一个新产品。

在从小数据转向大数据的时代,一群臭皮匠比一个诸葛亮更珍贵。在小数据时代,想要发现真相,最基本、最重要的就是减少错误。例如,若想知道本周一到周三某石油指数的收盘价格,那么每个价格都至关重要,可谓失之毫厘,差之千里;在大数据时代精确不再那么重要了,人们都在学着拥抱混乱,因为在分析、处理和运用大体量数据时,一个变量无法改变全局,正如无法在淡水湖中撒一把盐就把它变成大海。混乱是多样的数据格式带来的,银行可以远程开户,社保可以在线办理,出行可以人脸识别入闸,数据纷繁复杂,拥抱混乱是拥抱智能的先决条件。

在大数据时代,有时知道是什么就够了,没必要知道为什么。那么,如何知道是什么?通过分析海量看似不相关的数据,就能发现数据间的相关关系,即一个数据的数值变化时,另一个数据是不是同步变大或变小。如产品推荐分析,专注于在个人看似不相关的行为数据中建立内在联系,而为个人带来意想不到却正中下怀的推荐,计算机可能不明白他们为什么相关,但它知道人们购买的概率更大。

在大数据时代,万事万物皆可量化。几乎所有领域都可以采集信息存为数据利用数据,进而深度挖掘数据中蕴藏的商业价值。拿电子书阅读器来说,它捕捉到单个用户的文学喜好和阅读习惯等数据——浏览一页的时长、是否划线做笔记、略读还是放弃等,通过聚集和量化分析,可以获取一些意想不到的信息。有了大数据,人们描述世界的方式不再是我们认为”“自然规律这是一个社会现象的事件,而是意识到世界在本质上是由信息构成的。

值得注意的是,让数据主宰一切会带来许多风险。人们会担心自己时刻被监视,比如淘宝不断监视着用户的购物习惯、百度监视着用户的网页浏览习惯,而在微博里人们似乎没有只属于自己的心事。大数据的价值是在二次分析和挖掘中产生的,现在亟待构建完善的个人隐私保护体系。个人隐私保护和信息网络安全的课题被重新推上了历史舞台。

大数据时代并非只是数字和机器的冰冷时空,而是人与数字互动、人与机器互动的新世界。大数据重新定义着人们的生活和工作,重新塑造着人们的思维方式;反过来,人们的生活、工作和思维又推动着大数据的演进变化。大数据的全貌尚不可知,好比使用司南的春秋战国时代无法看到2000年后的全球定位系统。正如维克托·迈尔·舍恩伯格在《大数据时代》中说的大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。

阅读原文