地震能在刹那间摧毁一座城市。因为海底扩张和大陆漂移,地球的六大板块相互挤压碰撞,快速释放能量,就会产生地震波。从地下到地表,地震波一路越过重重阻碍、穿过不同岩层,较弱的地震波无法克服这些阻力,而较强的地震波则势如破竹、摧城拔寨,造成巨大损失乃至演变为灾难。
上述特指天然地震,如果把强震和弱震都算上,地球上每年发生大概500万次地震,不到10秒就会发生一次。地球物理勘探过程中还有一种地震,不是天然地震,而是为了透视地下油气藏使用的人工地震。
作为观测类科学,地震学的理论研究离不开大量的观测数据。那么,物探人员如何获取人工地震的数据呢?
物探人员在地表以人工方法激发地震波,地震波随即向地下传播,途中遇到岩层分界面,会发生一系列的反射与折射,释放出一系列的地震信号。通过地震检波器、地震记录仪(或地震勘探仪器)捕捉到这些地震信号,经过物探人员的分析处理,就能轻松“揭示”深埋地下的地质构造,石油、天然气等资源的位置也就一目了然了。
物探装备正向大容量、轻便、有线/无线兼容的地震仪器,数字检波器,大吨位、宽频带可控震源发展,推动宽频带、宽方位和高密度地震数据采集和五维地震数据应用的发展,奠定了地震大数据+人工智能技术应用的基础。石油物探数据涉及面积大、学科多,而且数据累积得越来越多。一块300平方千米的三维空间采集的数据量以T计量。那么,1T的数据有多大呢?如果以统一格式存储这1T的地震数据,那么一台电脑连续不断工作2.4小时可以读取完毕。只是数据往往不连续且格式复杂,读取就得消耗更多时间。
那么,如何储存石油物探的地震数据呢?用于石油物探的地震探测数据保存在磁带里,总量逐年累加,读取耗时逐年拉长,而宽频带、宽方位和高密度地震数据采集和五维地震数据应用等物探业务又要求“低时延”和“高效率”,设计合理的数据存储结构和共享方式迫在眉睫。
大数据解了燃眉之急。应用大数据的分布式存储技术(HDFS),将前面20T的数据分散存储在17万台计算机上,仅需1秒就能读取完毕。不过,地震数据也分“江湖地位”,访问频次越高,江湖地位越高,“管家Namenode”负责给数据“排资论辈”,安排到对应“房间”。
基础数据身份尊贵,会被安放在“贵宾室”——固态硬盘(SSD)中,读取速度快、耗电少、可靠性高,但造价相对高;运用于特定细分领域的数据只有特定的访客,它们被安置在“普通房”——通常为7200转的机械硬盘中,读取速度略慢于SSD,价格更低廉;那些年代过于久远、鲜有人拜访的数据则被安排在“地下室”——磁带和光盘中。
访客要拜访数据时,管家就把数据的门牌号——数据地址发送给访客。通过分布式存储技术,可以在较为低廉的普通硬件机器群上,两小时之内一次写入多次读取PB级的数据。PB级的数据量相当于连续播放2000年平均时长为4分钟的歌曲。
此外,地震数据来源各异、格式多样,在空间参考、时间尺度、存储记录等方面存在诸多差异,对分散地理空间数据进行集中管理和应用,就得联袂云和大数据。云存储把原来看得见、摸得着的机房和分布式计算等技术细节从台前拉到了幕后,为其披上了隐身衣,为多个用户提供访问共享存储池的能力。对于任何一个经授权的合法用户,云存储都是“黑箱”,用户无需了解系统是怎么构成的,也不需要了解系统怎么提供存储,却在任何地方都可以通过网络享用云端的数据和计算、分析等应用服务。云存储是未来地震大数据存储的发展方向,它将为敏捷的、打破空间限制的地震数据共享使用保驾护航。