Credit: Wilson Malone from Pexels
没有人能准确地预测地震何时发生。1994年洛杉矶北岭县发生6.7级地震,造成72人死亡,9000人受伤,250亿美元的损失。自那以来,南加州一直在焦急地等待“大地震”:一场预计至少为7.8级、强度为其44倍的毁灭性地震。地震学家只能说它可能在未来30年内发生。
尽管科学家无法预测地震发生的时间和地点,但做好准备是提高社会对大地震的抵御能力的关键。特别是,位于南加州大学的加州地震中心(SCEC)开发了CyberShake,这是一个模拟数十万次地震的计算平台,用于计算区域地震危害模型。
它揭示了南加州最容易发生强烈地震的地理区域,其结果影响了洛杉矶的建筑规范和美国地质调查局地震模型的设计。美国地质调查局是美国最大的地球和地质科学测绘机构。
然而,CyberShake的研究——以及许多现代科学——都是高度数据和计算密集型的。CyberShake的科学工作流程非常复杂,需要在本地和国家超级计算机上进行多步计算,这些计算任务相互关联,可以模拟60万次不同的地震。南加州大学维特比分校的信息科学研究所(ISI)拥有生成和管理此类海量数据的工具。
ISI计算机科学研究教授兼研究主任Ewa Deelman自2000年以来一直在不断设计和更新一个名为Pegasus的自动化工作流程管理系统。
优化工作流程
pegasus以规划执行和网格(PEG)和迪尔曼对马的热爱命名,将研究实验转化为优化的工作流程。由于它的抽象设计,从地震学到物理学再到生物信息学等各个领域的科学家都可以使用它。
迪尔曼将其比作烹饪食谱:“你可以在不同的厨房使用相同的食谱。不同的用户可以使用自己的炊具(计算资源)运行配方(工作流)。当你以足够广泛的方式设计事物时,它们就会变得广泛适用。”
2016年,激光干涉仪引力波天文台(LIGO)的科学家利用飞马座捕获了宇宙中的引力波,证实了爱因斯坦的广义相对论,并获得了2017年诺贝尔物理学奖。在ISI计算机科学家和LIGO成员之间长达16年的合作中,该软件管理着数千个工作流程和数百万个任务。
协同和自适应大气传感(CASA)是一个致力于改善危险天气预报和响应的工程研究中心,也将其管道移植到Pegasus。由于恶劣的天气会减缓和损害本地资源和计算能力,该项目将CASA的数据发送到云基础设施中,以确保连续的工作流程。
受动物行为启发
CyberShake在过去的15年里一直依赖Pegasus,包括它最近的一项研究,其中包括迄今为止最大的地震模拟集。Pegasus管理了2.5 pb的数据,在108天内运行了28,120个工作流程,在772,000个节点小时内生成了地震危险图。
SCEC的计算机科学家、CyberShake的首席开发者斯科特·卡拉汉(Scott Callaghan)说:“没有Pegasus,我们就无法进行这种科学研究。”SCEC将把CyberShake扩展到北加州,现在使用世界上最快的超级计算机Frontier。帕伽索斯会继续留在他们身边。
“每次我们做这样的研究,我们总是遇到意想不到的挑战。但我有信心,Pegasus团队能够帮助我们解决任何工作流程问题,这样我们就可以继续完成尖端的科学研究。”卡拉汉说。
Deelman现在正在进行研究和概念化SWARM,这是另一个工作流管理系统,其灵感来自于群居动物(如蚂蚁)之间巧妙的群体行为协调。她还计划用人工智能来增强Pegasus的决策能力,重新构想未来工作流系统的运作方式。