数据正在以前所未有的速度呈现出爆炸式增长。随着各类电子终端设备的普及,社交媒体、电子竞技和电子支付等网络服务愈加丰富,再加上智能手机和可穿戴设备的助力,一个人在哪里、做什么,甚至连身体的轻微变化,都被一一记录和分析着。
在大数据时代,人们对于事物的认知,正在从管中窥豹变成洞若观火,因为全量数据能帮助人们最大程度上接近真相。石化产品的研究本质是分子排列的创新组合和重构,在传统的石化企业,新产品的研发依赖研发人员的学识和经验,企业要承担这样的风险:研发人员提出的200个可能性组合,经过漫长的实验,可能颗粒无收。在大数据搭配人工智能的“黄金时代”,通过构建由分子属性、反应规则等非结构化数据组成的全量“知识库”,运用机器学习联动全量“知识库”就能探索几乎所有可行的分子组合,进而在若干个可能方案中诞生出一个新产品。
在从“小数据”转向“大数据”的时代,一群臭皮匠比一个诸葛亮更珍贵。在“小数据”时代,想要发现真相,最基本、最重要的就是减少错误。例如,若想知道本周一到周三某石油指数的收盘价格,那么每个价格都至关重要,可谓“失之毫厘,差之千里”;在大数据时代“精确”不再那么重要了,人们都在学着拥抱“混乱”,因为在分析、处理和运用大体量数据时,一个变量无法改变全局,正如无法在淡水湖中撒一把盐就把它变成大海。“混乱”是多样的数据格式带来的,银行可以远程开户,社保可以在线办理,出行可以人脸识别入闸,数据纷繁复杂,拥抱“混乱”是拥抱“智能”的先决条件。
在大数据时代,有时知道“是什么”就够了,没必要知道“为什么”。那么,如何知道“是什么”?通过分析海量看似不相关的数据,就能发现数据间的相关关系,即一个数据的数值变化时,另一个数据是不是同步变大或变小。如产品推荐分析,专注于在个人看似不相关的行为数据中建立内在联系,而为个人带来意想不到却正中下怀的推荐,计算机可能不明白他们为什么相关,但它知道人们购买的概率更大。
在大数据时代,万事万物皆可量化。几乎所有领域都可以“采集信息—存为数据—利用数据”,进而深度挖掘数据中蕴藏的商业价值。拿电子书阅读器来说,它捕捉到单个用户的文学喜好和阅读习惯等数据——浏览一页的时长、是否划线做笔记、略读还是放弃等,通过聚集和量化分析,可以获取一些意想不到的信息。有了大数据,人们描述世界的方式不再是“我们认为”“自然规律”或“这是一个社会现象的事件”,而是意识到世界在本质上是由信息构成的。
值得注意的是,让数据主宰一切会带来许多风险。人们会担心自己时刻被监视,比如淘宝不断监视着用户的购物习惯、百度监视着用户的网页浏览习惯,而在微博里人们似乎没有只属于自己的“心事”。大数据的价值是在二次分析和挖掘中产生的,现在亟待构建完善的个人隐私保护体系。个人隐私保护和信息网络安全的课题被重新推上了历史舞台。
大数据时代并非只是数字和机器的冰冷时空,而是人与数字互动、人与机器互动的新世界。大数据重新定义着人们的生活和工作,重新塑造着人们的思维方式;反过来,人们的生活、工作和思维又推动着大数据的演进变化。大数据的全貌尚不可知,好比使用司南的春秋战国时代无法看到2000年后的全球定位系统。正如维克托·迈尔·舍恩伯格在《大数据时代》中说的“大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”