第(2/3)页 系统表现出一模一样的测试结果,证明了克里的克隆是非常成功的。 紧接着杜克指示克里完成了4路,8路,32路,64路和128路服务器的模拟,经过了这番实际模拟测验,克里完全掌握了多路服务器硬件模拟,在这个基础上,杜克开始指示克里按照c ayxt5设计架构完成对泰坦ii超级计算机的模拟工作。 从超级计算机设计原理来说,其中并无神秘之处,泰坦ii也不过是众多搭载4个20核心te ama 处理器和32gb的内存的计算节点构成,从功能上将整个系统区分为计算阵列、加速阵列和服务阵列等三个部分组成。 由于这一切不过是众多计算机节点的串联,很快克里就完成了这个超级计算机系统模拟,但是杜克发现克里模拟出来的这台泰坦ii好像『性』能严重偏低于真实的泰坦ii。 按照休伊特介绍的泰坦ii『性』能,其稳定运算速度达到了15petaflops即每秒亿亿次,现在克里按照单纯的多路服务器模拟出来的软件泰坦ii,『性』能却只有其三十分之一左右。 这是怎么回事呢? 杜克回头仔细研究起泰坦ii的组成,网络上这方面的材料不少,杜克看了看泰坦ii使用的计算单元,才知道原来自己想得还是差了一些,因为在泰坦ii的构成中其中计算阵列、服务阵列分别由采用通用处理器cpu的计算节点机、服务节点机构成,而加速阵列则由基于图形加速处理器gpu的大量加速节点机构成,是一种“cpu+gpu”的异构协同计算。 因为单纯从浮点运算能力来说,一颗gpu的浮点运算能力相当于cpu的几十倍甚至几百倍,而且gpu的显存带宽可达cpu的十倍以上,而且延迟更低,对外数据吞吐能力也比cpu要强。 所以在设计的时候,对于单纯的浮点运算部分,如果用同等规模的gpu组成超级计算机的话,那么这个节点的浮点运算能力将提升百倍之多。而cpu的优势是在计算逻辑『性』较强、数据结构比较复杂的计算方面。 考虑到无论是核反应模拟计算也好,还是气候推测模拟也好,都涉及到大量的浮点运算,所以在泰坦ii系统中也采用了这种“cpu+gpu”异构协同架构,大量使用了nvidia公司生产的teslak20gpu作为主要浮点运算部件。 好在采用这种异构的不仅仅只有超级计算机,还有诸多的企业级服务器可以选择,杜克吩咐库赛当天就在波士顿买了一台。 为了确保模拟出来的泰坦ii和实验室中真实泰坦ii保持一致,这次杜克去实验室拿到了泰坦ii详细的cpu和gpu组成结构资料,这个参数又不是什么秘密,所以当克里完成了teslak20gpu的软件模拟工作后,重新按照泰坦ii架构实现了软件模拟。 !当软件模拟的泰坦ii测试出来这个结果,杜克激动了,克里终于实现了对于泰坦ii的再现,根据泰坦ii系统源代码版本重新编译出来的系统,也成功地运行在克里模拟的泰坦ii系统之上,可以说,现在克里已经完全实现了核反应模拟程序的运行环境。 万事俱备只欠东风,只剩下如何将这个应用程序下载到克里空间中了。 “杜克,你来了。”突然看见了几天不见的杜克,休伊特也不吃惊,正常地打着招呼,他知道自己这个师弟是一个名符其实的天才,现在同时在研究材料、计算机和核物理三个相差较远的学科,也不知道那颗脑袋究竟是怎么长出来的。 “师兄好,今天我过来看看权限申请是不是批准了。”杜克有礼貌地回到。 第(2/3)页