二、項目實施范圍
(一)曙光6000超級計算機系統:
序號 |
分區 |
分項 |
配置 |
計量 單位 |
工程數量 |
|
|
1 |
高性能計算--龍芯分區 |
龍芯節點 |
龍芯雙路服務器 |
臺 |
1280 |
|
龍芯機箱系統(含電路系統) |
套 |
320 |
|
龍芯網絡系統 |
HPP系統控制器 |
套 |
1 |
|
全局同步網絡 |
套 |
1 |
|
Infiniband 無阻塞網絡 |
套 |
1 |
|
千兆以太網(千兆系統) |
套 |
1 |
|
龍芯散熱系統 |
專用風冷機柜(含散熱設計) |
臺 |
12 |
|
存儲系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
6 |
|
曙光分布式存儲(2PB裸容量,1PB可用) |
套 |
1 |
|
2 |
高性能計算--科學計算分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
64 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 2GB內存 *12, 40Gbps Infiniband 子卡*1, NV Fermi C2050 GPGPU*1, Seagate 2.5” SAS硬盤*1 |
臺 |
640 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
16 |
|
機柜GPU散熱補充模塊 |
套 |
16 |
|
存儲系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
6 |
|
曙光分布式存儲(2PB裸容量,1PB可用) |
套 |
1 |
|
3 |
高性能計算--生命科學分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
96 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 2GB內存 *12, 40Gbps Infiniband 子卡*1, NV Fermi C2050 GPGPU*1, Seagate 2.5” SAS硬盤*1 |
臺 |
960 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
24 |
|
機柜GPU散熱補充模塊 |
套 |
24 |
|
存儲系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
12 |
|
曙光分布式存儲(4PB裸容量,2PB可用) |
套 |
1 |
|
4 |
高性能計算--工程計算分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
96 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 2GB內存 *12, 40Gbps Infiniband 子卡*1, NV Fermi C2050 GPGPU*1, Seagate 2.5” SAS硬盤*1 |
臺 |
960 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
24 |
|
機柜GPU散熱補充模塊 |
套 |
24 |
|
存儲系統 |
曙光FC SAN 光纖存儲(300TB) |
套 |
1 |
|
SAN文件系統 |
套 |
1 |
|
存儲網絡IO節點及SAN交換機 |
套 |
1 |
|
5 |
云服務--文化創意產業分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
64 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 4GB內存 *12, 40Gbps Infiniband 子卡*1, Seagate 2.5” SAS硬盤*1 |
臺 |
640 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
16 |
|
存儲系統 |
曙光FC SAN 光纖存儲(300TB) |
套 |
1 |
|
SAN文件系統 |
套 |
1 |
|
存儲網絡IO節點及SAN交換機 |
套 |
1 |
|
6 |
云服務--數據處理分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
96 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 4GB內存 *12, 40Gbps Infiniband 子卡*1, Seagate 2.5” SAS硬盤*1 |
臺 |
960 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
24 |
|
存儲系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
12 |
|
曙光分布式存儲(4PB裸容量,2PB可用) |
套 |
1 |
|
7 |
云服務--數字新媒體分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
48 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 4GB內存 *12, 40Gbps Infiniband 子卡*1, Seagate 2.5” SAS硬盤*1 |
臺 |
480 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
12 |
|
存儲系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
6 |
|
曙光分布式存儲(2PB裸容量,1PB可用) |
套 |
1 |
|
8 |
云服務--電子政務分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,冗余1000Mbps交換模塊*2 |
套 |
48 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 4GB內存 *12, Seagate 2.5” SAS硬盤*1 |
臺 |
480 |
|
散熱系統 |
APC機柜系統(含1:2列間空調等) |
臺 |
18 |
|
存儲系統 |
曙光FC SAN 光纖存儲(300TB) |
套 |
1 |
|
SAN文件系統 |
套 |
1 |
|
存儲網絡IO節點及SAN交換機 |
套 |
1 |
|
9 |
云服務--隔離服務分區 |
X86節點 |
TC3600機箱系統,10U,刀片機箱中板*1,40Gbps Infiniband QDR Switch線卡*1,冗余1000Mbps交換模塊*2 |
套 |
48 |
|
CB60計算刀片,Intel X5650 CPU*2,DDR3 4GB內存 *12, 40Gbps Infiniband 子卡*1,Seagate 2.5” SAS硬盤*1 |
臺 |
480 |
|
散熱系統 |
艾默生機柜系統(含水冷機柜、PDU等,不含室外水冷機組、控制系統、內外循環交換器、配電柜) |
臺 |
12 |
|
存儲系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
6 |
|
曙光分布式存儲(2PB裸容量,1PB可用) |
套 |
1 |
|
10 |
胖節點區 |
胖節點 |
曙光A840,4*AMD6136 2.4GHz 8核,128GB內存,5*300GB SAS RAID,QDR IB卡 |
臺 |
128 |
|
存儲系統 |
曙光FC SAN 光纖存儲(300TB) |
套 |
1 |
|
SAN文件系統 |
套 |
1 |
|
存儲網絡IO節點及SAN交換機 |
套 |
1 |
|
11 |
管理區 |
管理分區 |
系統登陸節點(含光纖網卡) |
臺 |
64 |
|
系統登陸節點(含QDR IB卡) |
臺 |
64 |
|
服務管理節點 |
臺 |
20 |
|
前端千兆交換機 |
臺 |
20 |
|
接入點光纖線架等 |
套 |
1 |
|
IO設備(監控機房) |
套 |
20 |
|
分頻切換設備 |
套 |
20 |
|
機柜系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
24 |
|
12 |
網絡系統 |
計算網絡 |
曙光6000計算網絡Mellanox 324口QDR Infiniband交換機 |
套 |
1 |
|
曙光6000計算網絡Mellanox 648口QDR Infiniband交換機 |
套 |
6 |
|
Finisar QSFP-QSFP(QDR) 10M/20M /30M IB 光纖線(含QDR IB轉換套件) |
條 |
2432 |
|
存儲系統QDR Inifinband網絡(含QDR IB網卡、交換機、子網管理器、光纖線纜等) |
套 |
1 |
|
散熱系統 |
APC機柜系統(含1:5列間空調) |
臺 |
12 |
|
機柜系統 |
風冷機柜系統(鋁鎂型材,含內部配電、配線、PDU等) |
個 |
12 |
|
管理網絡 |
曙光6000管理網絡骨干交換機 |
臺 |
3 |
|
作業網絡 |
曙光6000作業網絡骨干交換機 |
臺 |
12 |
|
電子政務網絡 |
曙光6000電子政務網絡骨干交換機 |
臺 |
2 |
|
隔離區網絡 |
曙光6000隔離網絡骨干交換機 |
臺 |
1 |
|
骨干萬兆 |
曙光6000萬兆骨干交換機(含萬兆模塊) |
臺 |
1 |
|
13 |
|
配套硬件 |
作業調度系統運行管理硬件平臺 |
套 |
10 |
|
Infinband Opensm管理硬件平臺 |
套 |
6 |
|
曙光分布式文件系統運行支撐硬件平臺 |
套 |
6 |
|
(二)曙光6000維保軟件
序號 |
分區 |
分項 |
配置 |
計量單位 |
工程數量 |
|
|
1 |
高性能計算--龍芯分區 |
軟件系統 |
操作系統(Linux) |
套 |
1 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
1 |
|
配套軟件 |
套 |
1 |
|
2 |
高性能計算--科學計算分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
640 |
|
曙光服務器備份還原軟件V1.0 |
套 |
640 |
|
曙光服務器智能導航軟件V2.0 |
套 |
640 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
1 |
|
3 |
高性能計算--生命科學分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
960 |
|
曙光服務器備份還原軟件V1.0 |
套 |
960 |
|
曙光服務器智能導航軟件V2.0 |
套 |
960 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
1 |
|
4 |
高性能計算--工程計算分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
960 |
|
曙光服務器備份還原軟件V1.0 |
套 |
960 |
|
曙光服務器智能導航軟件V2.0 |
套 |
960 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
5 |
云服務--文化創意產業分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
640 |
|
曙光服務器備份還原軟件V1.0 |
套 |
640 |
|
曙光服務器智能導航軟件V2.0 |
套 |
640 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
6 |
云服務--數據處理分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
960 |
|
曙光服務器備份還原軟件V1.0 |
套 |
960 |
|
曙光服務器智能導航軟件V2.0 |
套 |
960 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
1 |
|
7 |
云服務--數字新媒體分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
480 |
|
曙光服務器備份還原軟件V1.0 |
套 |
480 |
|
曙光服務器智能導航軟件V2.0 |
套 |
480 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
1 |
|
8 |
云服務--電子政務分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
480 |
|
曙光服務器備份還原軟件V1.0 |
套 |
480 |
|
曙光服務器智能導航軟件V2.0 |
套 |
480 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
9 |
云服務--隔離服務分區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
480 |
|
曙光服務器備份還原軟件V1.0 |
套 |
480 |
|
曙光服務器智能導航軟件V2.0 |
套 |
480 |
|
Intel編譯器 |
套 |
10 |
|
PGI編譯器 |
套 |
10 |
|
MKL庫 |
套 |
10 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
1 |
|
10 |
管理區 |
軟件系統 |
操作系統(Suse Linux 企業版) |
套 |
276 |
|
曙光服務器備份還原軟件V1.0 |
套 |
276 |
|
曙光服務器智能導航軟件V2.0 |
套 |
276 |
|
操作系統(Windows Server) |
套 |
20 |
|
Oracle 數據庫 |
套 |
5 |
|
11 |
其他 |
其他軟件 |
曙光GridView服務器管理系統標準版 V2.0 |
套 |
1 |
|
Intel編譯器 |
套 |
80 |
|
PGI編譯器 |
套 |
80 |
|
MKL庫 |
套 |
80 |
|
曙光分布式并行文件系統ParaStor V1.0 |
套 |
6 |
|
Totalview |
套 |
1 |
|
SourceInsight代碼調試器 |
套 |
50 |
|
PLATForm LSF作業調度系統 |
套 |
1 |
|
曙光自適應節能軟件Powerconf. 單機版 V1.0 |
套 |
5906 |
|
曙光DCIS機群部署系統軟件V4.0 |
套 |
5906 |
|
刀片服務器管理軟件v1.0 |
套 |
5600 |
|
三、具體技術要求
一、系統穩定性指標
1.全系統不發生因軟硬件故障或對軟硬件故障的維修,導致主機系統全機停機的情況(為滿足例行停機保養要求的情況除外)。
2.全系統節點可用率為99.5%以上。由于乙方的原因,全年全系統因故障導致的停機時間合計在45小時之下(其中,節點故障按節點故障導致節點失效的累計時間/總節點數計算,由于現場無備機備件無法修復故障的故障停機時間不計算入45小時要求。);
3.不發生因互聯設備故障導致主機系統全機全網絡崩潰;
4.同一節點兩次不同類型硬件故障間隔時間應在30天以上,同一節點兩次相同類型故障間隔時間應在60天以上;
5.同一互聯設備兩次不同類型故障間隔時間應在180天以上,同一互聯設備兩次相同故障間隔時間應在360天以上。
注:前述故障均指:
1)節點發生硬件故障(包括節點機內各個相關部件),導致節點失效;
2)節點發生操作系統崩潰、網絡中斷、死機后,重啟該節點無法恢復正常運行狀態;
3)凡重啟節點后,其操作系統加載正常、可恢復運行,其它軟件運行正常情況下,不屬于上述故障范圍,如屬用戶應用軟件問題或明確的第三方軟件問題導致操作系統崩潰,不屬于上述問題。
4)除節點外其它設備發生故障均指發生無法使其恢復正常使用功能的故障;互聯設備保證一定的冗余端口,可通過端口更換排查的故障不計入互聯設備故障。
二、故障響應時間和修復時間指標
1)節點的一般故障應在4小時內響應,8小時內恢復使用;重 大故障應在2小時內響應,4小時內恢復使用;
2)互聯設備的一般故障應在2小時內響應,4小時內恢復使用;重大故障應在1小時內響應,2小時內恢復使用;
3) 非曙光設備的一般故障應在4小時內響應,48小時內恢復使用;重大故障應在2小時內響應,24小時內恢復使用;
4) 以上約定故障恢復時間需甲方保障現場有相關備件,如缺少相關備件,故障恢復時間以相關備件到現場時間開始計時;
注:前述重大故障均指:
1)由于硬件故障,導致故障分區超過10%客戶的業務中斷;
2)由于存儲節點硬件故障,導致整個分區的數據文件損壞數量超過10%(損壞文件數/分區總文件數量);
3)由于文件系統故障,導致整個分區的數據文件損壞超過10%(損壞文件數/分區總文件數量)。
四、項目實施目標
1.中標方委派二名技術人員常駐超算現場參與系統運行管理與日常維護。
2.保修期內免費提供硬件保修和軟件維護人工服務,不提供備件。
3.全系統不發生因軟硬件故障或對軟硬件故障的維修,導致主機系統全機停機的情況(為滿足例行停機保養要求的情況除外)。
4. 全系統節點可用率為99.5%以上。由于乙方的原因,全年全系統因故障導致的停機時間合計在45小時之下(其中,節點故障按節點故障導致節點失效的累計時間/總節點數計算,由于現場無備機備件無法修復故障的故障停機時間不計算入45小時要求。)。
5.不發生因互聯設備故障導致主機系統全機全網絡崩潰
6.同一節點兩次不同類型硬件故障間隔時間應在30天以上,同一節點兩次相同類型故障間隔時間應在60天以上;
7. 同一互聯設備兩次不同類型故障間隔時間應在180天以上,同一互聯設備兩次相同故障間隔時間應在360天以上。
注:前述故障均指:
1)節點發生硬件故障(包括節點機內各個相關部件),導致節點失效;
2)節點發生操作系統崩潰、網絡中斷、死機后,重啟該節點無法恢復正常運行狀態;
3)凡重啟節點后,其操作系統加載正常、可恢復運行,其它軟件運行正常情況下,不屬于上述故障范圍,如屬用戶應用軟件問題或明確的第三方軟件問題導致操作系統崩潰,不屬于上述問題。
4)除節點外其它設備發生故障均指發生無法使其恢復正常使用功能的故障;互聯設備保證一定的冗余端口,可通過端口更換排查的故障不計入互聯設備故障。
8.節點的一般故障應在4小時內響應,8小時內恢復使用;重大故障應在2小時內響應,4小時內恢復使用;
9.互聯設備的一般故障應在2小時內響應,4小時內恢復使用;重大故障應在1小時內響應,2小時內恢復使用;
10.非曙光設備的一般故障應在4小時內響應,48小時內恢復使用;重大故障應在2小時內響應,24小時內恢復使用;
11.以上約定故障恢復時間需甲方保障現場有相關備件,如缺少相關備件,故障恢復時間以相關備件到現場時間起計時;
注:前述重大故障均指:
1)由于硬件故障,導致故障分區超過10%客戶的業務中斷;
2)由于存儲節點硬件故障,導致整個分區的數據文件損壞數量超過10%(損壞文件數/分區總文件數量);
3)由于文件系統故障,導致整個分區的數據文件損壞超過10%(損壞文件數/分區總文件數量)。
五、現場支持服務內容
現場支持服務包含四項內容:駐場工程師、巡檢服務、假日駐場、咨詢和培訓服務。
5.1駐場工程師
依據深圳超算的請求,投標人在深圳超算安排兩名資深駐場工程師,日常技術支持服務內容包括但不限于:曙光6000硬件故障處理,存儲系統維護,曙光6000以太網絡系統維護,曙光6000 IB網絡系統維護。
依據超算業務的需求變化,對曙光6000系統進行系統優化調試。每次調整的規模都比較大,而且停機窗口非常有限。投標人需要針對系統調整制定詳細的實施方案,而且在方案實施過程中,需要有必要的人力投入,相關費用都由投標人承擔。
5.2 巡檢服務
投標人依據曙光6000系統各個部件的平均無故障運行時間,結合系統的使用年限,制定完善的巡檢計劃。每個月提供一次系統巡檢服務。
6.3 假日駐場
在春節、五一、國慶等傳統重大節日,投標人安排專人留駐深圳超算保障系統運行,同時協助深圳超算完成例行停機檢修。深圳超算每年會對曙光6000系統資源作一次全面檢查,檢查期間會對軟件作升級,投標人須安排技術人員現場技術支持。
6.4 咨詢和培訓服務
深圳超算的客戶包含各領域的領先客戶,這類客戶的需求非常獨特。投標人定期安排專人對深圳超算的工程師做技術培訓,培訓內容包括但不限于:《ParaStor200云存儲系統介紹》、《ParaStor存儲關鍵技術介紹》、《高性能計算技術探討》、《云計算技術簡介與Cloudview產品》、《Infiniband介紹與使用》等等。