中国青年报客户端讯(中青报·中青网记者 张渺 )近日,由中国科学院上海天文台葛健研究员带领的国际团队,通过人工智能的深度学习,对国际斯隆巡天三期释放的类星体光谱数据进行了微弱信号搜寻和数据分析,发现了极其稀少的107例宇宙早期星系内冷气体云块成分的关键探针中性碳吸收体。研究团队分析发现,早在宇宙约30亿年的演化早期,这些携带了中性碳吸收体探针的早期星系已经过了快速物理和化学演化进入介于大麦哲伦矮星系和银河系之间的物理和化学演化状态。相关研究成果于5月15日发表在国际天文学顶级期刊《皇家天文学会月报》上。
本次工作的研究方法与成果,对探索星系如何形成和演化提供了新的研究方式,也充分显现了人工智能在天文海量数据中探寻微弱信号的广泛应用潜力和前景。研究冷气体和尘埃对理解星系形成和演化至关重要,想要研究冷气体和尘埃需要探针。早期宇宙的星系离我们太遥远,无法将星系自身发的光作为探针来观测并研究冷气体和尘埃。然而,宇宙中比星系要亮百倍以上的类星体所发出的光,在经过宇宙早期星系时会被其中的气体和尘埃吸收,产生类星体的吸收光谱。其中,中性碳的吸收光谱可以帮助天文学家准确跟踪冷气体运行,因此,中性碳吸收体成为研究星系形成和演化的重要探针。
据研究团队解释,中性碳原子基态的精细结构能级差别很小,中性碳吸收线的信号微弱且极其稀少,需要在海量的类星体光谱数据中才能找到,如同大海捞针。使用传统的搜寻方法需要耗费大量时间,找到的假信号较多,又很容易漏掉一些微弱信号。
为了解决这一问题,研究团队通过使用人工智能的深度学习方法,设计神经网络,生成基于实际观测的中性碳吸收线特征的大量仿真样本去训练深度学习神经网络,并使用这些被“训练好”的深度学习神经网络,在斯隆巡天三期释放的大量数据中,搜寻中性碳吸收体。通过这样的方式,研究团队很快发现了极其稀少的107例宇宙早期星系内的冷气体云块成分的关键探针——中性碳吸收体。本次获得的样本数是此前获得的最大样本数的近两倍之多,并且成功探测到了更多比以前更微弱的信号。
“此前已知的中性碳吸收线的样本数很少,无法直接使用这么小的样本对深度学习神经网络进行充分训练。”葛健指出,“与此同时,需要探测的两条中性碳特征吸收线不仅微弱,还分布在诸多的强吸收线中间,神经网络很容易在训练中被强吸收线误导,产生训练偏差,从而影响到探测出真正的中性碳特征吸收线的灵敏度。”
研究团队采用了创新的方法训练人工智能,使深度学习神经网络的探测精度达到了99.8%,探测完备性也显著提升了约30%,达到了99%的完备性。研究团队提到,这种人工智能的训练和搜寻方式大大缩短了搜寻时间,提高了探测灵敏度和对微弱信号探测的完备性。
区别于韦伯太空望远镜通过星系发射光谱来研究,本次工作中,研究团队通过观测类星体的吸收光谱来研究早期星系,这将为未来宇宙和星系早期演化研究提供了一个全新且有效的研究手段。
“本次工作的突破性发现是人工智能在天文大数据领域应用的一个里程碑。要想使用人工智能在海量的天文数据中‘挖’到重大新发现,就需要发展创新的人工智能算法,使之能快、准、狠——即快速、准确、完备地探寻到这些很难在传统方式下找到的稀少而微弱的信号。”葛健指出,这一创新方法具有在多领域图像识别以及微弱信号探测中巨大的应用价值和潜力。
责任编辑:梁国胜
来源:中国青年报客户端