增强系统可扩展性,保持计算周期内恒定的低延迟和整体性能优化
国家电网ADPSS首先遇到的是系统可扩展性的挑战,因为伴随供电设备、线路等等的增多,需要不断的增加计算节点实现电网实时的仿真。国家电网电科院电力系统研究所张星说到:“在现有的平台下,我们发现,在为集群增加一个或多个计算节点时,会导致计算周期内数据延迟增加,这不但会直接影响仿真性能,严重时还导致错误的仿真计算结果进而影响电网运行决策。”
除了扩展性的需求,国家电网ADPSS对系统的仿真延迟有着严格的需求。仿真系统从被测设备获得输入数据进行大规模电网仿真计算后输出的过程称为一个仿真步长。国家电网ADPSS要求每一个仿真步长都是精确的50微秒,仿真系统的低延迟和硬件平台以及软件环境息息相关,例如处理器、网卡、操作系统、编译器、集群消息传递接口等等。
“国家电网ADPSS不但要求7*24不间断安全稳定的运行,而且要求实时仿真的数据延迟保持较低和恒定的状态。高延迟无法实现在线的实时电网仿真,延迟的抖动会导致在故障发生时无法确定是系统故障还是设备故障。因此,我们迫切需要一套硬件软件一体化的完整解决方案解决这些难题,以保障电网的安全稳定运行。” 国家电网电科院电力系统研究所张星说。
此外,国家电网还需要对ADPSS实现整体性能优化。让多方硬件、软件能够协同的稳定运行已经非常困难,此外还存在系统的更新,例如,驱动程序和操作系统之间的兼容性等难题。国家电网电科院电力系统研究所张星谈到:“我们期望找到一套硬软件一体化的解决方案,并针对国家电网ADPSS的需求进行整体性能优化,同时能够避免后顾之忧,让技术人员从软件的更新部署、兼容性排查等繁重的工作中解脱出来,将更多的时间专注在研究ADPSS的功能优化或其它系统开发上。”面对这些难题,国家电网和英特尔和风河公司紧密合作,完成了英特尔硬件软件一体化解决方案的概念验证和详细测试,最终,国家电网决定为其ADPSS系统部署基于英特尔技术的软硬件一体化解决方案。
选择英特尔硬软件一体化解决方案
确保国家电网ADPSS计算周期内的延迟需要硬件平台和软件环境的紧密集成。国家电网为其ADPSS选择了基于英特尔至强处理器E5-2600系列的服务器,网卡采用英特尔®以太网千兆位服务器适配器I350,运行环境为风河Linux实时操作系统,部署英特尔®数据面开发套件,并选用英特尔®Cluster Studio进行编译,集群之间的通讯统一采用英特尔消息传递界面库。这些软件和开发工具全部针对英特尔架构进行了优化,提供最好的硬件和软件集成。