FLOPS

编辑:百年网互动百科 时间:2020-01-21 13:24:47
编辑 锁定
本词条缺少名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!
FLOPS(即“每秒浮点运算次数”,“每秒峰值速度”),是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。
在这里所谓的“浮点运算”,实际上包括了所有涉及小数的运算。这类运算在某类应用软件中常常出现,而它们也比整数运算更花时间。现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点运算器”(FPU)。也因此FLOPS所量测的,实际上就是FPU的执行速度。而最常用来测量FLOPS的基准程式(benchmark)之一,就是Linpack
中文名
每秒所执行的浮点运算次数
外文名
floating-point operations per second
包括了
所有涉及小数运算
简    称
FLOPS

目录

FLOPS评价

编辑
许多专家对FLOPS颇多微词,认为它并不是一个有意义的量度(measurement),因为FLOPS并不能反应出许多对执行效能有影响的因素。例如:I/O的效能、内存的架构、快取内存一致性(cache coherence)、...等。这意味着电脑的实际计算容量,与FLOPS的理论峰值间会有一段不小的差距。

FLOPS换算

编辑
一个MFLOPS(megaFLOPS)等于每秒一佰万(=10^6)次的浮点运算
一个GFLOPS(gigaFLOPS)等于每秒十亿(=10^9)次的浮点运算,
一个TFLOPS(teraFLOPS)等于每秒一万亿(=10^12)次的浮点运算,(1太拉)
一个PFLOPSpetaFLOPS)等于每秒一千万亿(=10^15)次的浮点运算,
一个EFLOPS(exaFLOPS)等于每秒一佰京(=10^18)次的浮点运算。

FLOPS其他

编辑
现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点单元”(FPU)。也因此 FLOPS 所量测的,实际上就是 FPU 的执行速度。而最常用来测量 FLOPS 的基准程序(benchmark) 之一,就是 Linpack。
1GHz 就是每秒 十亿次运算,如果每次运算能完成两个浮点操作,就叫 2G FLOPS(每秒二十亿次浮点操作)。现在家用的双核计算机通常都能达到每秒 五十亿次运算(2*2.5GHz)左右的水平,浮点性能大约是上百亿次浮点操作。超级计算机发展得很快,目前划分超级计算机的门槛是“每秒一万亿次浮点操作”,是家用微机的一百倍以上,几年以后这个门槛预计会提高到十万亿次。超级计算机几十、上百万亿次的 FLOPS 也是靠多个处理器(通常还是多核)堆起来的,比如的IBM Roadrunner (走鹃,一种喜欢在地上飞快地走的小鸟)有 6562 个 AMD Opteron双核处理器,12240 个 PowerX Cell 8i 处理器, 其中主要的浮点运算能力是由 Cell 处理器提供的, 每个 Cell CPU 包括 8 个浮点处理核心,你可以理解为 8 核。 (Cell也是 Sony PS3 游戏机的处理器,不过用于PS3的比用于超级计算机的要次一等) 总体来看,就是 2 * 6562 = 13124 个通用处理器核心; 8 * 12240 = 97920 个专用处理器核心。 你说这么多钱堆出来的这么十多万个核心,速度能不快吗? 它的速度是 1.026 P FLOPS, 也就是每秒超过 一千万亿次浮点操作

FLOPS运算能力

编辑
中国的一台叫做「天河2号」的超级计算机,跑出了30.65PFlops的惊人纪录,比当今世界上最快的那台还要快上 74%!
这份成绩的惊人之处在与,这是基于Intel平台的天河2号(又称银河2号)还没开足马力的情况下取得的成绩。经过一次5小时的LINPACK测试,动用了16,000个节点中的14,336个,也就是90%的运算节点,测到了前面提到的30.65PFlops(1 petaflop=1千万亿次浮点计算/秒)LINPACK软件包被用来测试全球500强大型计算机的运算能力。现在的Top1是美国的泰坦,有17.5PFlops的计算速度。天河2号的效能比是1.935GFlops/瓦,略逊于泰坦的2.143GFlops/瓦。
天河2号的数据,本周在田纳西大学教授Jack Dongarra的论文中被披露,他编写了LINPACK软件包,并且负责每年修订500强排行榜两次。教授没有说明,天河2号的战绩是否会正式收提交,并被录到最新的排行榜中。但不管怎么样,新榜单将在6月17日公布.
天河2号计划今年年底入驻广州的国家超级计算机中心,天河2号的组装和测试主要由中国国防科技大学(NUDT)承担。一旦验收通过,天河2号将对外开放平台,用于实验和教育领域。
天河2号使用Intel Ivy Bridge和Xeon Phi 处理器,「32,000颗Ivy Bridge的Xeon和48,000颗的Xeon Phi共计2,120,000个内核。」Dongarra写道。天河2拥有12.4PB的硬盘和1.4PB的内存。NUDT采用自己的分布式计算技术,Dongarra描述为:「光电混合传输技术(optoelectronics hybrid transport technology),上层采用主干拓扑结构,通过13个路由,每个路由有576个端口连接。并运行麒麟LINUX系统。」
理论上,天河2号具备54.9PFlops的计算能力。但Top500上的机器大多达不到理论值,但如果天河2号开足马力,还有很大的提升空间。
天河2号是天河1号的后续产品,天河1号曾经在2010年11月等上过Top500的头把交椅,而且长时间排在前8位,运算能力2.57PFlops。[Junius_Lou via Ars]
词条标签:
计算机学