中国科学家如何利用大数据构建“数字孪生”地球?

发表时间: 2023-05-22 17:14

机器学习方法助力“数字孪生”地球建设。 中科院青藏高原所 供图

中新网北京5月22日电 (记者 孙自法)在当今的万物互联时代,地球大数据呈现爆炸式增长。如何从海量、多源、异构、泛在的地球大数据中汲取所需的信息和知识,实现数据-信息-知识-决策链条的贯通,进而推动建设“数字孪生”地球?这些问题的破解之道备受关注,也迫在眉睫。

中国科学院青藏高原研究所(中科院青藏高原所)22日发布消息说,在中科院战略性先导科技专项“地球大数据科学工程”支持下,中科院青藏高原所李新、冯敏研究员与该专项首席科学家、可持续发展大数据国际研究中心主任郭华东院士合作,并联合中科院西北生态环境资源研究院、武汉大学、中科院空天信息创新研究院、三极观测与大数据研究团队等科研同行共同研究,系统总结大数据在地球系统科学领域的进展和挑战,并提出助力建设“数字孪生”地球(Digital Twin of Earth)的先进方案。

地球大数据推动“数字孪生”地球发展。 中科院青藏高原所 供图

这项地球大数据和“数字孪生”领域重要研究成果论文,近日已在国际专业学术期刊《自然综述:地球与环境》(Nature Reviews Earth& Environment)在线发表。

论文第一作者和共同通讯作者李新研究员介绍说,合作研究团队通过分析遥感、原位观测和实验分析、社会感知、模拟和再分析等四类地球大数据特征,提出能够将自然-社会大数据纳入地球系统模型的大数据同化方法框架,并探讨通过深度学习、物理知会的机器学习、因果推断、深度强化学习解决地球系统科学中高维数、复杂性和非线性难题的关键。这些大数据分析方法弥补了传统方法在可预测性、可迁移性、可解释性和决策支持方面的不足,可为推动智能化“数字孪生”地球建设提供先进的解决方案。

地球系统科学的机遇与挑战。 中科院青藏高原所 供图

研究团队认为,大数据同化是融合地球大数据和地球系统模型的重要方法。大数据同化可以利用先进计算资源,实现机器学习与数据同化方法的共生集成,完成超高分辨率地球系统模型和多源地球观测(如遥感、台站、社会感知等)的相互融合,实现地球系统在洲际乃至全球时空尺度和物理意义上的一致表达,进而为“数字孪生”地球提供驱动引擎。

与此同时,研究团队从数据密集型地球系统科学的角度,对深度学习、物理知会的机器学习、因果推理、深度强化学习等四种前沿大数据分析方法的具体应用场景和方案进行深入研究指出,科学大数据分析方法将助力数据驱动新地学的发展,其中,深度学习在解决地球系统高维度、复杂的非线性问题中表现出前所未有的潜力;深度学习与物理知会的机器学习和因果推理相结合,可以增强在地球系统科学研究中的可迁移性、可解释性和可预测性;深度学习与强化学习和多智能体建模相结合,则能够为解决复杂的决策问题提供有效方法。

大数据同化方法与应用。 中科院青藏高原所 供图

“‘数字孪生’地球的建设需要全面的包容性,需要深时、深地、深空的全面数据支撑。”该合作研究团队强调指出,随着地球步入“人类世”时代,“数字孪生”地球的实现需要自然系统“硬”数据与社会系统“软”数据的无缝集成,从而捕捉自然系统和社会系统的复杂交互,而科学、开放、共享的大数据科学环境和基础设施建设则正是“数字孪生”地球的关键保障。他们表示,实现“数字孪生”地球将是一个漫长而艰难的旅程,更加广泛的跨学科合作和更加开放的科学环境将有助于克服这些挑战,推动实现面向地球系统科学的人工智能工具

据了解,“数字孪生”即数字“双胞胎”,也被称为数字映射、数字镜像,它是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。“数字孪生”是个普遍适应的理论技术体系,可在产品设计制造、医学分析、工程建设、智能制造等众多领域应用。(完)

来源: 中国新闻网