--- layout: default ---

太湖之光

"走进超级计算机"

Posted by Xz Yao on June 26, 2016

昨天Top 500公布了新的全球超级计算机500强。蝉联了6届(3年)第一名的天河二号终于让位于了新的冠军,神威太湖之光(这名字可真中二啊,吃我一招,太湖之光?)。和每年一样的是,新闻一出,网络上就充满了各式各样的评论。

comments.png

网上各式各样的评论,用网友的话总结起来就是,西北人民尚在吃草,你国的这些超算都是闲置,又不是全国产,堆硬件有什么意思?今天我们就来聊聊超算的前世今生。

447890876004240300.jpg

这次刷屏的太湖之光的父母是国家并行计算机工程研究中心。1999年就推出了第一台超算。当时放置在了国家气象局进行天气预报工作,而不是高大上的核爆之类的这方面工作。所以,网上的喷子们所说的超算无用论,在这第一台零号机上(神威-I型机)上就被驳斥地体无完肤了。

值的注意的一个点是,在次年,江泽民总书记亲笔为该计算机系统题名“神威”,李岚清副总理到场祝贺,并对计算机产业的发展做了重要批示,国务院专门发了贺电。当时的峰值计算速度大概是3840亿次每秒。(对比,这次的太湖之光的运算能力大约是10亿亿次每秒)

现在我国的超算主要有三大系列,曙光,大家对他的第一次认知可能是在中小学的思想政治课本里,是曙光公司制作的。天河系列,主要是国防科技大学等高等院校制作的。再有一个就是这次出现在公众视野里的总参五十六所,江南计算研究所(俗称江南所),是目前解放军最大的计算机技术研究所。江南所是有军方背景的,所以他们研制的超算也主要应用于核爆模拟等军方的领域。基本不会民用。

除了网友们喷的用Intel Xeon系列CPU的超算以外,我们国家也一直在制造利用国产CPU芯片的超级计算机。说到CPU,我们国家也有很多了其实。其中最广为人知的应当属于龙芯系列。

loonson.png

龙芯公司的父母是龙芯中科,这名字一听就是中科院背景下的,没错,中科院持有这家公司67%的股权。这家公司的特别之处在于经常使用学生作为劳动力。龙芯中科和深大也有着非常深的渊源,每年深大都会送一些学生前往龙芯中科实习(不过这是一个坑)。深大陈国良院士的团队也常年致力于打造基于龙芯的超算。在USTC时打造了KD(科大)系列的超算,在深大打造了SD-30作为深大三十周年的献礼(虽然时隔三年之后才完成验收)。 61516412.gif

但是实际上用学生的话,是会有很多问题的。私以为比较重要的一个原因就是,人员流动性太大,而这种芯片的设计又需要持久的投入才可以。因此效率会比较低。

龙芯的一个比较好的优点是,应用范围比较广,可以民用。现在龙芯中科公司也有民用级别的产品。值的注意的是,龙芯系列采用的是MIPS指令集,据我个人所知,这个指令集现在基本上也只有龙芯在用了。这个指令集不是国产的,可以黑。

在太湖之光上出现的芯片是申威系列的。申威系列的曝光度要低很多,它的父母就是我们之前提到过的总参五十六所。这个芯片其实是DEC Alpha的遗产了。虽然说是遗产,但是DEC这个公司还是很强悍的。AMD的K7 Micro Architecture也是DEC Alpha的遗产。现在申威算是Alpha留下的唯一的后代了,拥有自主扩展指令集和发展路线的自主权。

2010年神威蓝光超级计算机上使用了申威1600的芯片。这一次使用的芯片则是申威26010芯片。这个芯片的资料并不是很多。不过正是由于Alpha架构的特性,这次的超算的能耗比大大降低,100PFlops的计算能力功耗只有15Mw,对比之下,天河二号的运算能力大约在35PFlops,功耗17MW。抛弃了Intel Phi和X86架构之后提升非常明显。(注意,这里不是说x86不好,我没有任何的这个意思,而是适用场景的问题)

超级计算机的应用是非常广泛的。实际上,当投资人们在大聊特聊人工智能、大数据、AR/VR的时候,我觉得更值得的是深入研究一些超级计算机领域的知识。除了与我们相隔甚远的核爆等领域的应用以外,天气预报,地震预测各个领域都会应用到超级计算机。各地也都在努力应用各种超级计算机,让他服务于民生。仅举一个大家比较感兴趣的例子,在我们所看到的电影动漫,比如加勒比海盗。Lucas Film使用了超过2000个节点的计算机来处理相关的镜头。现在的天河二号、天河一号上也有很多相关的应用。

nuclear-simulation.jpg 现在各地建的超算中心也越来越多了,除了新建的无锡中心外,还有深圳中心(中科院牵头成立,然而现在他们好像和隔壁的先进技术研究院关系并不好哈哈哈哈)、天津中心、长沙中心、广州中心、济南中心(这四家是由科技部牵头) 447890876004240300.jpg

说全世界都在拼100PFlops这个量级的超级计算机或许不太妥当,因为只有中美两国有这个实力。在过去的一年里,我在各种各样或私下或公开的场合,都有听说NVIDIA在和DARPA/DOD一同设计远超天河二号、达到100PFlops计算能力的超级计算机。这次被天朝抢了一血,不知作何感想。

当然,现在中美两国都已立项1000Pflops的超级计算机(exa-scale super computer)。时间都在2020年前后,到那时,也许各种各样的应用又会截然不同。

附一些深圳超算中心的图: 146201285152789912.jpg 584892138452596022.jpg 314898415478638918.jpg