欧洲大型强子对撞机粒子碰撞可以生成大量数据,运算法则可以对其进行处理。图片来源:CERN
下一代粒子对撞机实验将会使用全球最先进的“思考机器”,使粒子物理学家和人工智能(AI)研究人员之间建立合作关系。这样的机器只需要微不足道的人力投入,然而这样的前景却让一些物理学家感到不舒服。
瑞士日内瓦大型强子对撞机(LHC)物理学家希望,未来10年能够通过不可想象的海量数据作出重要发现,并获取海量知识,受此动机驱动,他们正在招募AI专家助力研究进程。
上个月,来自粒子物理学界和人工智能领域的专家首次共聚一堂,讨论如何通过先进的人工智能技术加速LHC的科学发现。粒子物理学家“已经意识到,他们不能单打独斗”。法国巴黎大学计算机学家Ccile Germain在欧洲核子中心(CERN)粒子物理实验室研讨会上说。
计算机学家正在陆陆续续地作出回应。去年,德国帮助组织了一次程序编写竞赛,旨在在一系列模拟数据中“发现”希格斯玻色子的踪迹,该竞赛吸引了1700多个团队的申请。
可以说,粒子物理学和人工智能已经不再陌路。特别是,LHC的两个大型探测器实验——ATLAS(回型LHC实验装置)和CMS(紧凑型μ子螺旋型磁谱仪)——在2012年发现希格斯玻色子时,就使用了机器学习能力,即“训练”运算法则识别数据模式的一种人工智能。
但在不远的未来,粒子物理实验需要在收集数据方面变得更加智能化,而不仅仅是对其进行处理。现在,CMS和ATLAS每秒可以进行亿万次撞击,利用快速、粗糙的标准会导致每1000次撞击中忽视掉1次撞击。而2025年的升级计划意味着,每秒相关撞击次数将会增加20倍,为此那些探测器设备就需要使用更加精确的统计方法,美国帕萨迪纳市加州理工学院CMS物理学家、帮助组织此次CERN研讨会的Mara Spiropulu说:“我们正在走向一个未知领域。”
另一项LHC探测实验或许也能带来灵感。这个名为LHCb(大型强子对撞机底夸克实验)的项目旨在研究粒子与其反物质的不对称性。为了准备LHC今年4月开始的这一轮一秒钟高能物理实验,LHCb团队利用机器学习能力对探测器进行了编程,用来决定哪些数据需要保留。
LHCb对细微的温度和压力变化极为敏感,因此在实验过程中随着时间变化收集的数据也会非常有趣,因为机器学习能够适应实时变化。“以前没人这样做过。”LHCb物理学家、带领AI项目的Vladimir Gligorov表示。
在设备升级之后,粒子物理实验通常需要花费数月进行校准,Gligorov说。但是在能量升级两周内,该探测器就“再次发现”一种叫作J/ψ介子的粒子,该粒子于1974年由两个美国实验团队分别发现,随后被认为是诺贝尔奖级的科学发现。
Spiropulu和一些专家表示,未来几年,CMS和ATLAS很可能会追随LHCb的脚步,并且将让探测器运算法则开展更多实时检测与计算工作。“那将会对我们如何进行数据分析带来变革。”Spiropulu说。
然而,日益倚重人工智能进行决策也会带来新的挑战。和LHCb不同,该实验主要聚焦寻找已经发现的粒子,因此可以详细地研究采集粒子过程,但是ATLAS和CMS的设计目的是发现新粒子。从原理上说,一些被丢掉的数据也可能包含重要发现,而利用运算法则生成的标准可能没有透明度,这让很多物理学家感到忧虑,Germain说。她表示,研究人员希望了解这些运算法则如何发挥作用,从而确保它们是基于物理原则的。“否则这对他们来说如同噩梦。”
支持这种方法的物理学家还需要让他们在人工智能领域的同事放弃已经过实践检验的公式。Gligorov说:“这些都是大型实验合作项目,所以如果要证明一个新方法,可能要花费极长的时间。”LHCb有1000多名参与成员,而ATLAS和CMS的参与科学家都超过3000人。
尽管存在这些挑战,研讨会上讨论最热的一个话题是粒子物理是否应该利用更加复杂化的人工智能以及如何利用这种被称为深度学习的相关技术。机器本体学习运算主要采用样本数据如图像等来训练,然后“说出”每张图片上的内容是什么,比如是一所房屋还是一只猫。但是深度学习主要利用一些软件(如谷歌翻译和苹果公司的声音识别系统Siri),计算机不能进行监管,只能找到方法识别这些物体。
人工智能的深度学习能力将会使科学家发现理论上尚未预测过的新粒子,CMS团队成员、CREN参与组织此次研讨会的物理学家Maurizio Pierini说:“它可能是一份保险,以防提出正确理论预言的科学家尚未出生。”