上??萍即髮W(xué)GPU集群----單一來(lái)源公示

發(fā)布時(shí)間2014-05-09文章來(lái)源 設(shè)備與資產(chǎn)處作者責(zé)任編輯

采購(gòu)代理機(jī)構(gòu):上海市政府采購(gòu)中心

邀請(qǐng)采購(gòu)供應(yīng)商:華菁電子科技(上海)有限公司

單一來(lái)源理由:上??萍即髮W(xué)信息學(xué)院計(jì)劃采購(gòu)高性能服務(wù)器1套,以滿(mǎn)足大規(guī)模分布式估計(jì)和檢測(cè)、大型分布式存儲(chǔ)系統(tǒng)的信息論研究,大規(guī)模的認(rèn)知系統(tǒng)設(shè)計(jì)等科學(xué)研究項(xiàng)目需求,并用以培養(yǎng)研究生基于高性能計(jì)算集群的理論研究和項(xiàng)目開(kāi)發(fā)能力,同時(shí)需要符合現(xiàn)有機(jī)房溫度和噪聲、以及集群可擴(kuò)展性等方面的要求。配置要求如下:

PSC-4S計(jì)算節(jié)點(diǎn)2臺(tái),每臺(tái)配置如下

外形 塔式

處理器(CPU)≥2顆,Intel Xeon  E5系列處理器≥2.1GHZ主頻≥6核,

內(nèi)存(Memory)      ≥8*8G DDR3 ECC REG 1600 MHz,可擴(kuò)展

硬盤(pán)(Hard Drive) ≥2TSATA高速硬盤(pán),可擴(kuò)展

RAID支持  支持RAID:0、1、5、10

GPU卡片     ≥3片,NVidia并行計(jì)算卡≥2496CUDA核心顯存≥5GB DDR5

驅(qū)動(dòng)盤(pán)(DVD Driver)  包含所有驅(qū)動(dòng)程序等原廠(chǎng)安裝包

操作系統(tǒng)     64位操作系統(tǒng),預(yù)裝ACM集群管理軟件;

PSC-4S存儲(chǔ)管理節(jié)點(diǎn)1臺(tái),配置如下

處理器(CPU)≥2顆,Intel Xeon  E5系列處理器≥2.1GHZ主頻,≥6核,

內(nèi)存(Memory)      ≥4*8G DDR3 ECC REG 1600 MHz,可擴(kuò)展

硬盤(pán)(Hard Drive) ≥5TSATA高速硬盤(pán),可擴(kuò)展

RAID支持  支持RAID:0、1、5、10

驅(qū)動(dòng)盤(pán)(DVD Driver)包含所有驅(qū)動(dòng)程序等原廠(chǎng)安裝包,GPU配套應(yīng)用軟件,CUDA集群平臺(tái)管理包

操作系統(tǒng)     64位操作系統(tǒng),預(yù)裝ACM集群管理軟件;

集群附件,共包括

光纖收發(fā)器 infiniband40GB 8端口QSFP

網(wǎng)卡      3塊infiniband40GB

交換機(jī)  24口千兆交換機(jī)

電源      ≥2個(gè)32A 8聯(lián)萬(wàn)用PDU

集群管理軟件    ACM集群管理軟件。

經(jīng)調(diào)研發(fā)現(xiàn)華菁電子科技(上海)有限公司開(kāi)發(fā)的產(chǎn)品可以滿(mǎn)足我方教學(xué)科研需求:

需求1. 高性能計(jì)算設(shè)備的計(jì)算能力能達(dá)到理論計(jì)算值的70%以上,最大化資金投入以及計(jì)算能力的回收。.

此次選用的GPU集群采用兩臺(tái)PSC-4S作為計(jì)算,理論浮點(diǎn)運(yùn)算性能約為7.02 TFLOPS(1.17TFLOPS每GPU)。

采用IB網(wǎng)絡(luò)群集以及IB 40Gb高速HCA卡,保證群集計(jì)算中大量數(shù)據(jù)實(shí)時(shí)交換的需求;減少延時(shí)性能損失,實(shí)際浮點(diǎn)計(jì)算能力超過(guò)理論值的80%,不低于5.616 TFLOPS。

需求2. 提供原廠(chǎng)免費(fèi)的群集管理軟件,方便對(duì)計(jì)算群集進(jìn)行管理和監(jiān)控。

這次選擇的廠(chǎng)商提供自主研發(fā)的GPU/CPU群集管理軟件。軟件提供中英文界面,提供遠(yuǎn)程的web統(tǒng)一管理界面,方便群集的遠(yuǎn)程管理。另外軟件中提供相應(yīng)的群集調(diào)度器(支持CPU/GPU),支持遠(yuǎn)程提交計(jì)算任務(wù)以及參數(shù)設(shè)定。在計(jì)算過(guò)程中,軟件支持實(shí)時(shí)的硬件資源監(jiān)控,可動(dòng)態(tài)調(diào)整計(jì)算節(jié)點(diǎn)的負(fù)載。

軟件需具備快速部署功能,易于恢復(fù)、增加、刪除節(jié)點(diǎn),以方便后期對(duì)集群進(jìn)行調(diào)整。

支持多用戶(hù)管理,并且可以設(shè)置不同權(quán)限的系統(tǒng)用戶(hù),方便集群管理和使用。

需求3. 對(duì)集群的開(kāi)發(fā)環(huán)境要求

支持并行編譯環(huán)境:GNU C/C++編譯器;GNU Fortran77/903編譯器;OpenMPI;MPICH/Lam-MPI;PVM; Python;Perl;Java;

支持高性能計(jì)算函數(shù)庫(kù):ACML LAPACK;Blacs;ScaLAPACK;BLAS;GOTO;Atlas;Intel MKL,Lapack;FFTW;

支持GPU軟件:cuBlas cuFFT;cuSparse;cuRand;npp;OpenCL

需求4. 群集將在辦公室使用,需要滿(mǎn)足靜音要求。

采購(gòu)的PSC-4S集群通過(guò)靜音機(jī)箱搭建,在滿(mǎn)足機(jī)器散熱性的同時(shí)也充分保證了機(jī)器的算熱性以及穩(wěn)定性。集群在工作期間噪音大約45dB。

需求5. 廠(chǎng)商需要有能力對(duì)我們的CUDA項(xiàng)目的支持以及培訓(xùn)。

供應(yīng)商提供有Intel Cluster Ready資質(zhì),并且有數(shù)十位英偉達(dá)GPU官方技術(shù)認(rèn)證工程提供支持服務(wù)。

每年該供應(yīng)商能提供2次由英偉達(dá)官方授權(quán)工程師講解CUDA開(kāi)發(fā)相關(guān)培訓(xùn)。

需求6. 產(chǎn)品質(zhì)量以及售后服務(wù)

AMAX的生產(chǎn)基地都通過(guò)ISO9001,ISO14001,TL9000認(rèn)證,

對(duì)每臺(tái)服務(wù)器提供整機(jī)五步測(cè)試:部件檢測(cè)、系統(tǒng)組裝、高溫測(cè)試、性能檢測(cè)、最終質(zhì)量檢驗(yàn)

提供測(cè)試性能報(bào)告:操作系統(tǒng)與CUDA的兼容性和穩(wěn)定性測(cè)試報(bào)告、24小時(shí)負(fù)載99%耐高溫測(cè)試報(bào)告、72小時(shí)壓力測(cè)試報(bào)告、40個(gè)小時(shí) Burn in測(cè)試報(bào)告、Function test機(jī)器穩(wěn)定性和散熱的測(cè)試報(bào)告、ATA(AMAX Test Automation)自動(dòng)化測(cè)試體系、FlexStar硬盤(pán)廠(chǎng)商級(jí)硬盤(pán)測(cè)試系統(tǒng)、等多重認(rèn)證,高等級(jí)無(wú)塵生產(chǎn)環(huán)境

對(duì)所購(gòu)買(mǎi)群集進(jìn)行整合性測(cè)試,以L(fǎng)inpack作為標(biāo)準(zhǔn)將群集性能調(diào)整到最優(yōu)。廠(chǎng)商在上海有設(shè)辦公點(diǎn),日后的工程師上門(mén)支持以及響應(yīng)能得到保證。

因此計(jì)劃從華菁電子科技(上海)有限公司采購(gòu)該套服務(wù)器設(shè)備。

有關(guān)單位或個(gè)人如對(duì)本項(xiàng)目采用單一來(lái)源采購(gòu)方式有異議,應(yīng)在本公示發(fā)布之日起7個(gè)工作日內(nèi)以書(shū)面形式向(單位:上海科技大學(xué)            地址:岳陽(yáng)路319號(hào)8號(hào)樓1109室           郵編:   200031        聯(lián)系方式:    54200161       聯(lián)系人:    金文虎     )反映。