“在你的辦公室里構(gòu)建高速計(jì)算中心”———我校研制成功國內(nèi)首個(gè)基于Windows操作系統(tǒng)的GPU高性能計(jì)算集群
一個(gè)普通的實(shí)驗(yàn)室里,在一臺(tái)普通的臺(tái)式機(jī)上發(fā)出一條集群工作的指令,通過一個(gè)小小的交換機(jī),三臺(tái)計(jì)算機(jī)同時(shí)進(jìn)行演算,一個(gè)蒙特卡洛的計(jì)算問題在3秒鐘內(nèi)就完成了,比單獨(dú)由一臺(tái)機(jī)器完成的速度提高了60倍以上。這個(gè)簡單例子的演示直觀地展示了“基于windows操作系統(tǒng)的GPU(圖形處理器)高性能計(jì)算集群”。
日前,由我校信息科學(xué)與技術(shù)學(xué)院研制成功了國內(nèi)首個(gè)“基于windows操作系統(tǒng)的GPU高性能計(jì)算集群”,該集群具有峰值浮點(diǎn)計(jì)算能力高、廉價(jià)、配置靈活、易于擴(kuò)展、使用方便、能效高等突出優(yōu)點(diǎn),可滿足國內(nèi)眾多學(xué)科對(duì)于超高性價(jià)比的綠色高計(jì)算能力的需求,非常適合于100人以下規(guī)模的小公司、高校院系級(jí)計(jì)算中心、及課題組或?qū)嶒?yàn)室等單位快速組建自有的高性能計(jì)算平臺(tái)。
據(jù)項(xiàng)目負(fù)責(zé)人駱祖瑩老師介紹,該GPU高性能計(jì)算集群包括1個(gè)基于Windows/HPC/Server/2008/R2集群操作系統(tǒng)的頭節(jié)點(diǎn)、與10個(gè)基于Windows/7操作系統(tǒng)的工作站節(jié)點(diǎn)。工作站節(jié)點(diǎn)采用中央處理器與圖形處理器的異構(gòu)臺(tái)式機(jī),CPU為4核8線程的i7-860處理器,GPU為每秒1.63萬億次峰值浮點(diǎn)計(jì)算能力的GTX470處理器。整個(gè)GPU高性能計(jì)算集群的峰值浮點(diǎn)計(jì)算能力為每秒16.3萬億次,峰值功耗4.95KW,占地40平米,僅耗資10萬元。
在系統(tǒng)集成方面,目前主流的計(jì)算機(jī)集群都是基于高可靠性的服務(wù)器進(jìn)行系統(tǒng)集成,可滿足長周期無故障的連續(xù)工作,但價(jià)格昂貴,為強(qiáng)調(diào)可靠性的大型或?qū)I(yè)機(jī)構(gòu)所擁有。而該項(xiàng)目研制的GPU集群則采用臺(tái)式機(jī)設(shè)備進(jìn)行系統(tǒng)集成,同時(shí)臺(tái)式機(jī)又采用了主流的CPU與GPU配件,即插有高性能顯卡的多核CPU臺(tái)式機(jī),所以該GPU集群具有價(jià)格低廉、通用、高性能等優(yōu)點(diǎn),但其可靠性稍差,對(duì)于大多數(shù)既需要高性能計(jì)算能力而又不需要長時(shí)間運(yùn)行的小型單位而言,這是一個(gè)非常理想的高性能集群廉價(jià)集成方案。
在應(yīng)用方面,目前主流的計(jì)算機(jī)集群都采用Linux或Unix操作系統(tǒng),具有可靠性高、兼容性好的優(yōu)點(diǎn),但需要專業(yè)人士進(jìn)行集群的使用與維護(hù)。而該項(xiàng)目研制的GPU集群采用了Windows/HPC/Server/2008/R2集群操作系統(tǒng)(Win-dows7操作系統(tǒng)的HPC版,2010年8月正式發(fā)布),易于使用與維護(hù),不需要專業(yè)人士,節(jié)約維護(hù)成本。同時(shí),由于所有工作站節(jié)點(diǎn)均為采用Windows7操作系統(tǒng)的臺(tái)式機(jī),做集群計(jì)算時(shí),它是集群的工作站節(jié)點(diǎn);不做集群計(jì)算時(shí),它就是一臺(tái)普通的臺(tái)式機(jī),可以處理文本、表格、流媒體等日常工作,也可以進(jìn)行單機(jī)版GPU+CPU并行計(jì)算的計(jì)算機(jī)算法研究。在了解了GPU集群多用途的優(yōu)點(diǎn)并具備相應(yīng)條件后,普通用戶便可以在原有的辦公室或?qū)嶒?yàn)室中直接構(gòu)建一個(gè)高速計(jì)算中心,體驗(yàn)GPU高性能計(jì)算集群帶來的工作便利了。
在我校地遙學(xué)院“圖像幾何矯正”應(yīng)用研究中,與采用4核8線程CPU并行加速算法的2分鐘執(zhí)行時(shí)間相比,采用GTX470顯卡的GPU并行加速算法的執(zhí)行時(shí)間僅為3.7秒。
課題組基于該GPU高性能計(jì)算集群,目前已開展了電子設(shè)計(jì)自動(dòng)化、加解密、數(shù)據(jù)挖掘、圖形圖像處理、視頻處理、虛擬現(xiàn)實(shí)等算法加速研究,初步研究工作表明:與配置4核8線程CPU的單機(jī)并行加速相比,該GPU集群可以獲得2個(gè)數(shù)量級(jí)以上的加速效果。在地球遙感、災(zāi)難控制、生命科學(xué)等學(xué)科都可以廣泛應(yīng)用。 (新聞中心 曹寧)