2023年5月,美国能源部发布《面向科学、能源和安全的人工智能》,围绕人工智能在科学研究、能源开发和国家安全等重大领域的前沿研究方向开展讨论,并规划了后续的工作。元战略摘编报告核心内容,解读美国能源部人工智能未来发展方向。
当前,人工智能技术正在迅速发展、进步,再加上美国能源部(DOE)通过量子计算计划部署的百亿亿次级计算系统,DOE在科学、能源和安全领域的核心任务正处于关键时刻。多年来,DOE对世界一流的物理实验、观测和计算基础设施进行了大量投资,开发了必要的基础理论、模型和软件,同时提出了使用这些基础设施所需的多样化设计、操作和专业知识。这些人力和技术基础设施使DOE能够利用并提高人工智能的能力。
01 发挥美国能源部在计算和数据领域的领导作用
人工智能最有希望的进展来自于规模效应,因此计算能力对于推动人工智能的未来发展至关重要。DOE的百亿亿次级计算项目(Exascale Computing Project,ECP)的团队由来自DOE实验室、学术界和工业界的1000多名科学家、工程师和项目支持人员组成。他们提出了ECP愿景,并积极进行策划和执行,最终他们不仅能够引领全球,且重新定义了该领域。
在2022年,ECP部署了全球排名第一、性能和容量超过四台系统总和的世界首台百亿亿次级超级计算机。2023年,第二台DOE百亿亿次级机器将拥有两倍于此的容量。ECP借助多年来在软件、设施和科学人才方面的投资,包括国家核安全局(NNSA)的国防计划高级模拟计算(ASC)以及科学办公室(SC)的先进计算(SciDAC)和能源科学网络(ESnet)计划,为科学、能源和国家安全任务提供了广泛的支持。这种基于物理模型的建模和仿真的基础设施涵盖了计算的各个方面,从基本的数学算法到系统软件,从工作流到数据管理,可以说涉及了处理、存储、通信硬件以及系统架构的方方面面。
然而,这些人力和财务投资的回报也使模型、代码和工作流变得更加复杂。即使在百亿亿次级计算系统上,模型产生的庞大数据已超过传统数据管理、策划和分析能力的限制,这些任务非常复杂且依赖于专业人员。此外,这些挑战揭示了当今社会面临的一个关键问题:如何理解用于训练大型语言模型的数据。在这方面,人工智能还提供了管理数据和计算软件基础设施的新方法。这意味着我们需要同时具备弹性和稳健性的复杂模型。
DOE在百亿亿次级计算以及相关基础设施方面的世界领导地位,将奠定其在科学、工程和安全领域的领导地位,因为这些领域都依赖于计算建模和仿真。此外,ECP利用人工智能和机器学习方面的进步,加速了先导应用的进展,其中一些进展只有通过百亿亿次级计算和相应规模的数据才能实现。这些创新在驱动新的科学、能源和安全领域仍有巨大潜力。而且,将新的AI模型应用于传统的建模和仿真方法,极大地提高了计算速度,最终增加了这些系统的容量。
此外,ECP还揭示了一点,即随着新的人工智能方法所需的计算和数据规模的增加,将会出现更严峻的技术挑战,因为这需要百亿亿次级模拟技术能力以及支持DOE任务领域的计算和数据资源的整体容量的持续增长。而且,解决设计、部署和运行百亿亿次级计算系统的巨大成本本身也依赖于人工智能模型。这些投资是具有潜力的,通过与传统行业建立非传统的合作伙伴关系,这些投资将会对人工智能和计算产生重大的影响。因此,及时采取积极的行动对于维持和延续ECP计划已经创造的成果和基础设施十分重要。
02 利用工业进步提升美国的领导地位
工业界和国家的巨额投资推动了人工智能领域的创新发展,而这些投资主要集中在工业发展和国家安全至关重要的应用上。基础技术和方法的研发,以及工业和国防应用的基础设施设计和投资策略将有助于促进DOE在科学、能源和安全领域的发展。但是,如果没有DOE的领导和持续的投资,目前最强大的系统将在中国、日本和欧盟运行,以支持他们在科学、能源和安全领域的领导地位。
尽管美国和其他国家的工业和国防领域正在取得快速发展,但对DOE来说,许多和工业或国防相关任务的核心目标并没有实现。
然而,DOE在超大规模系统、大规模数据基础设施、软件、人工智能理论和应用方面的投资以及独特的协同设计方法,使其在人工智能的应用方面处于独特地位,并帮助巩固其在科学、能源和安全领域的全球领导地位。本报告中概述的新的人工智能方法可以拓展DOE的任务领域,但是,这些新方法和由此产生的应用程序不会以渐进式的方式自行发展——它们需要一个复杂的、综合的、具有规模的系统性举措。这不仅会影响计算应用的各个方面,而且会影响科学仪器、用户设施以及实验和操作基础设施的设计、优化甚至组装和运行。
03 应用基本的人工智能方法:构建模块
自2019年DOE首次举办人工智能研讨会以来,已经提出并实践了六种主要的人工智能“方法”。2022年,DOE实验室组织了第二组人工智能研讨会,研究了“概念构建模块”(conceptual building blocks),每个模块都以基本的人工智能能力为基础,如推理、优化和深度学习。DOE明确了应用这些方法的机会、必须克服的挑战以及需要达成的具体目标。相应地,这些高级研究方向(Advanced Research Directions,ARDs)揭示了DOE基础设施和计算方法中的交叉技术需求。最后,DOE需要评估整体的准备情况(包括硬件、劳动力等方面)以实施必要的方法、后勤保障和文化变革。DOE不仅要应用新的人工智能技术来支撑其完成使命,而且还要提升科学领导力,以提高国家在科学、能源和安全领域的竞争力。
在2019年的研讨会之后,科学界编写了一份全面的报告,列出了16个领域的机会和挑战,这些领域包括材料科学、复杂系统工程、数学和计算机科学等。然而,该报告中所涉及的方法不是处于早期形成阶段,就是在某些情况下尚未显示出相应的潜力,例如,机器学习的进展(特别是自我监督、迁移和深度学习)与大规模数据的融合。2019年所提出的人工智能方法的现状表明,如果将这些方法应用在DOE科学、能源、安全、工程和基础设施方面的基础研究上,将获得可观的收益。
自2019年以来,人工智能大模型逐渐显示出颠覆性的能力,人工智能技术的发展迎来了新的拐点。在这个拐点上,DOE有机会寻找新的发展路径。简而言之,全球领导地位不能通过渐进式的进步来实现。
04 抓住机遇;应对新挑战
这一成功转型也将加剧现有的挑战。要发挥多样化科学队伍的创造力和有效性,就需提高对多代研究人员进行人工智能方法培训的标准。为实现从传统建模和仿真到人工智能方法的自上而下的转变(包括自主发现、机器人技术以及在交叉领域的相关再创造),当前许多初级研究的职位可能被淘汰。因此,在重塑劳动力方面必须要重视伦理的作用。
除了劳动力的挑战、严格的数据整理以及人工智能模型训练相关的任务以外,也出现了其他问题。例如,与训练数据有关的新漏洞,有意或无意插入的数据会破坏训练模型的正确性等。本报告强调了面对新挑战时,我们需要全新的数学、理论、数据和模型评估的基本方法和途径。
05 领导力蓝图
DOE的核心使命面临一系列重大挑战,本报告以此为基础制定了一个行动蓝图。工业界的进展与DOE的任务紧密相关且有积极影响,但工业界的数据与DOE在科学、能源和安全领域的数据在性质和内容上存在很大差异。DOE的人工智能计划必须与人工智能的宏观发展趋势相协调,其中许多趋势是由工业界主导的,并得到越来越多的私营部门的支持。
本报告反映了人工智能的5个宏观趋势:
1. 人工智能模型的规模将越来越大,并具有全新的涌现能力,其训练将超过美能源部ECP建模和仿真所需的最大计算资源。
2. 大模型的训练需要准备和编码庞大的多模态数据流和数据源。
3. 从数据与仿真模型之间1:1的关系转变为数据与人工智能模型之间(与多个“n”建模任务相适应和应用)1:n的关系。
4. 这种趋势需要广泛而严格的评估套件(evaluation suites),这将远远超出当前建模和仿真项目的需求。
5. 为了应对这种趋势,需要大规模的软件工程和编程工作,同时需要可支持大型社区的通用基础模型。这与目前建模/仿真范式下许多个体研究者创建的定制模型和评估套件的情况形成鲜明对比。
随着DOE在能源、科学和安全领域中对计算、数据和实验方法的重塑,现有的建模和仿真系统会得到改变。但更重要的是,它将带来一系列新的应用,将人工智能的能力融入到多个环节中。这种转变将从混合应用(人工智能方法和传统方法)以及类似的混合工作流工具(mixed workflow tools)开始,并在未来几年内实现端到端的替代。此外,先进的现代仿真和可视化工具,例如,在基于工程应用中建立的“数字孪生”正在迅速应用于复杂的科学领域。对人工智能的关注和全面振兴DOE科学事业的需求,反映了人工智能与国家的未来及其在全球秩序中的重要角色密切相关。这一情况反映在美国白宫、美国国家科学院、工业界以及非政府来源的报告中。这些报告均传递出同一信息,即人工智能是引发各国竞争的领域之一。
表 人工智能用于科学、能源和安全领域的预期结果
本报告为DOE提供了一个全面的愿景,即利用和扩展人工智能的新能力,以促进科学、能源和安全等领域的发展,DOE具备合适的资源和能力来解决当今社会面临的与人工智能相关的新挑战,应该紧抓机遇,承担责任,运用创造性的方法来应对这些挑战,促进人工智能技术的发展。
报告译自:美国能源部会官网
报告题目:ADVANCED RESEARCH DIRECTIONS ON AI FOR SCIENCE, ENERGY, AND SECURITY
报告链接:https://www.ornl.gov/file/advanced-research-directions-ai-science-energy-and-security/display
免责声明:文章内容系作者个人观点,如有任何异议,欢迎联系我们!图片来源网络,如有侵权请联系删除。
编译 | Mark 周苡 Zoie Y. Lee
编辑 | 周苡
审校 | 周苡 Zoie Y. Lee 王暖
声明:本文来自元战略,版权归作者所有。文章内容仅代表作者独立观点,不代表士冗科技立场,转载目的在于传递更多信息。如有侵权,请联系 service@expshell.com。