关于“调整后的峰值性能(APP)”的技术注释
调整后的峰值性能(APP)是指数字计算机在进行64位或更多位的浮点加法和乘法运算的调整后的峰值速度。
本技术说明涉及的缩写:
n “数字计算机”中的处理器数量
I 处理器编号(1,……,n)
ti 处理器时钟周期(ti=1/Fi)
Fi 处理器频率
Ri 峰值浮点运算速度
Wi 体系结构调整因子
APP用加权万亿次浮点运算(Weighted TeraFLOPS (WT))表示,单位是1012调整后的每秒浮点运算。
APP的计算方法如下:
1.确定数字计算机中的每个处理器i在每个时钟周期内执行的64位或更多位的峰值浮点操作次数(FPOi)。
注: 在确定FPO时,仅包括64位或更多位浮点加法、浮点乘法运算。所有浮点运算必须表示为每个处理器时钟周期所执行的运算次数;需要多个时钟周期完成的运算 可以表示为每个时钟周期完成运算的分数值。对于不能进行64位或更多位浮点操作数的处理器,其有效浮点运算速度R为0。
2.计算每个处理器的浮点运算速度R,Ri= FPOi/ ti
3.计算APP,APP=W1×R1+ W2×R2+…+ Wn×Rn
4.对于“向量处理器”,Wi=0.9;对于非“向量处理器”,Wi=0.3
注1:对于在一个时钟周期内能够完成复合运算的处理器,比如:同时进行加法和乘法运算,所有运算次数都计算在内。
注2:就流水线处理器而言,有效浮点运算速度R取流水线满时的流水线速度,或非流水线速度中的较高值。
注3:在计算APP之前,应先对每个参与运算的处理器,按照其最大可能的理论值来计算其运算速度R。如果计算机生产商在手册或资料中声称,该计算机能够进行并发、并行、同时操作或运行,则在计算R时,应考虑同时操作的因素。
注4:计算APP时,不应考虑那些仅负责输出/输入和外部设备功能(如:磁盘驱动器、通信及视频显示等)的处理器。
注5:计算APP的值,不考虑通过“局域网”、广域网、I/O共享连接或共享设备、I/O控制器以及任何由“软件”实现通讯互连的处理器组合。
注6: 计算APP的值,必须包括通过聚合、同时运算和共享内存方式专门设计用于增强系统性能的处理器组合。
技术说明:
1)聚合在同一芯片上的所有同时运行的处理器和加速器;
2)处理器组合共享内存方式,是任一处理器通过高速缓存块或存储字的硬件传输、不用任何的软件机制可以访问系统中的任一内存地址。该方式可以通过2.2中规定的“电子组件”获得。
注7:“向量处理器”定义为内置向量指令的处理器,这些指令能够同时进行多重浮点向量(64位或更多位的一维数组)运算,且处理器中至少含有2个向量功能部件和至少8个向量寄存器,每个向量寄存器至少包含64个数据单元。