大数据时代的智慧海洋建设展望
作者: 冯文波 来源: 中国海洋报 编辑: 陈骏佼 时间:2019-01-18 14:48:33
近年来,伴随着数据科学的迅猛发展,“大数据”似乎一夜之间融入到各行各业。在海洋领域,大数据甚至与人工智能、超算一起被誉为带动海洋科学发展的“新三驾马车”。如何获取、管理和用好海洋大数据,发挥其在智慧海洋建设中的作用,如何实现海洋大数据科学与人工智能的交叉融合,已成为当今海洋学界关注的重要话题。
智能物联网 提升大数据获取能力
近日,在国家发改委2018年度国家地方联合工程研究中心名单中,由中国海洋大学信息科学与工程学院院长、青岛海洋科学与技术试点国家实验室高性能科学计算与系统仿真平台主任魏志强教授领衔申报的“海洋大数据国家地方联合工程研究中心”荣列其中。作为中国海洋大学首个国家地方联合工程研究中心,这将有力推动青岛海洋科技创新能力建设,特别是以海洋大数据为核心的智慧海洋建设。
何为智慧海洋?在魏志强看来,就是把新一代信息技术融合到海洋领域。大数据、超算和人工智能作为新一代信息技术的典型代表,成为智慧海洋建设的核心支撑。“三者中,海洋大数据是基础,也是智慧海洋建设的灵魂。”魏志强说。关于海洋领域的数据科学与大数据技术,他归纳为三大板块:“大数据怎么来”“大数据怎么放”“大数据怎么用”,即海洋大数据的获取、存储和应用。
近年来,伴随着海洋观测技术的发展,围绕海洋大数据的获取,我国已基本形成了空、天、地、海多元立体化的采集系统,但与智慧海洋建设需求还有一定的距离。
在深海大洋进行数据采集,传感器是必不可少的装置,而目前我国海洋科研领域使用的高端传感器90%以上源自进口,这一领域的关键技术和核心设备还掌握在少数发达国家手中。“这对我们来说是‘卡脖子’的关键技术,必须要突破。”魏志强说。此外,深远海、南北极等极端或恶劣环境下的大数据获取,也迫切需要有高质量、高分辨率的传感器来完成监测和传输工作。
在海洋观测和大数据获取方面,如何充分考虑海洋大数据的“时空耦合”“地理关联”等特性,实现空、天、地、海等不同运载平台之间的协同观测,从“单点”走向“组网”?在魏志强看来,破解这一“瓶颈”的关键是“海洋智能物联网”,即人工智能、大数据技术与海洋物联网的深度融合,此举也将为未来海洋大数据的获取提供强有力的支撑。
超算互联网 打造经略海洋新高地
“通过海洋观测和探测获得的大数据,好比是产品加工的‘原材料’,我们不仅要有存储‘仓库’,还要有科学合理的制度体系把‘原材料’管理好,做到安全、可控、高效;紧随其后的是‘原材料’的加工环节。加工首先要有‘设备’,其次要有‘工艺’。”魏志强用生动的比喻来描述海洋大数据的存储、管理、分析和加工。他进一步谈到,海洋大数据的加工处理主要取决于“软”“硬”两个方面,“软”是指“算法”即数据科学与大数据技术;“硬”是指装备,即超级计算机,两者之和便是大家耳熟能详的“超算”。
2018年10月,第十四届全国高性能计算学术年会在青岛举行。来自海洋和信息技术领域的多位专家学者进行了深入探讨,为“超算”与海洋科研深度融合把脉开方。“以超算平台、超算互联网体系为代表的重大装备类平台是开展全球气候研究、能源矿产勘探、生物医药研发、人工智能支撑等必不可少的大科学装置,是科研工作急需,且对未来创新至关重要的平台。”大会主席、中国科学院院士吴立新在《从智慧海洋到智慧未来》的主题报告中指出。
拥有海洋大数据可以更好地认识海洋,掌控大数据才能更好地经略海洋,超算便是掌控海洋大数据的关键。海洋试点国家实验室拥有目前全球海洋科研领域运算速度最快的P级超级计算机,每秒运算速度可达2.6千万亿次,并构建了目前全球速度最快的百G超宽网络、百公里毫秒级超低延时超算互联网。
“我们把海洋试点国家实验室超算中心、国家超算济南中心、国家超算无锡中心3个中心的超算大科学人工智能和大数据公共支撑平台装置统一互联起来,构建形成了一套超算大科学装置群。”魏志强说。在这一超算互联网体系中,神威E级原型机、神威太湖之光、神威蓝光、浪潮千万亿次超级计算机共同服务于海量、多源、异构的海洋大数据分析处理。
相对于当下的P级超算,E级超算是指每秒可进行百亿亿次数学运算的超级计算机,被公认为是“世界超级计算机界的下一顶皇冠”。近来,中国、美国、日本等国均提出了百亿亿次计算机研制计划。令人欣喜的是,我国研制的百亿亿次超级计算机“神威”E级原型机已于2018年8月在国家超算济南中心亮相,人类迈进E级超算时代近在咫尺。“其服务于海洋领域,为经略海洋打造新的高地,也指日可待。”魏志强说。
矢志深蓝 以科技造福全人类
随着技术的发展与创新,多项与大数据和智慧海洋相关的项目正在建设,并取得了可喜的成果。
2018年7月,在青岛举行的2018年全球海洋院所领导人会议上传来消息。中国工程院院士、青岛海洋生物医药研究院院长管华诗发布了全球首个海洋天然产物三维结构数据库。“打造‘蓝色药库’是人类的共同事业,我们开放数据库,希望助力人类的健康事业。”管华诗说。
海洋天然产物三维结构数据库容纳了30117个海洋天然产物的准确三维结构,可直接用于虚拟筛选与智能药物设计,大大提升了海洋药物的研发效率。“这是新药筛选平台和超算平台交叉融合的生动体现,也是药物研发设计与海洋大数据平台和信息技术学科交叉的重大成果。”魏志强表示。
目前,借助该数据库,管华诗团队已经完成了170余个美国相关机构批准的肿瘤药物靶点对海洋化合物数据库的精确筛选,发现了1000余个具有开发前景的抗肿瘤药物苗头分子,发现了诸多可开发为海洋药物的先导化合物。
“深蓝大脑”是海洋试点国家实验室高性能科学计算与系统仿真平台重点打造的“全球海洋人工智能与大数据系统”。该系统涵盖全球与区域海洋和气候预测、海洋药物智能筛选、海底战略性能源智能勘探、海洋生态系统演变预测、海洋大数据智能分析等众多领域,致力于更准确、更精细、更高效地为海洋科技创新服务。
近年来,随着大数据的汇集、理论算法的革新和计算能力的跨越式提升,以及脑科学和人工智能技术的进一步发展,以类脑智能为代表的新一代人工智能技术逐渐绽放光芒。这也给以人工智能和大数据技术为基础打造的“深蓝大脑”提供了跃升的机会。“未来的‘深蓝大脑’将面向浩瀚海洋,实现从机器智能向类脑智能的转化,实现从机器学习到深度学习再到自主学习的跨越,从而在信息处理机制上类脑、认知行为和智能水平上类人,使机器拥有人类认知能力及协同机制,实现对未来‘透明海洋’系统的智能自驱动、自发现和自演进。这是‘深蓝大脑’进化的必由之路,也是海洋科学技术发展的重要途径。”魏志强说。(记者 冯文波)