現(xiàn)代戰(zhàn)爭3數(shù)據(jù)包( 現(xiàn)代戰(zhàn)爭數(shù)據(jù)包3)

摘要: 使用 Equality 網(wǎng)絡(luò)拓?fù)鋵?duì)多 exaflops 機(jī)器進(jìn)行性能評(píng)估在現(xiàn)代計(jì)算架構(gòu)中,由于核心數(shù)量的增加,圖論是重頭戲。不斷尋找更好的連接核心的方法是必不可少的。本文重新審視了...

使用 Equality 網(wǎng)絡(luò)拓?fù)鋵?duì)多 exaflops 機(jī)器進(jìn)行性能評(píng)估

在現(xiàn)代計(jì)算架構(gòu)中,由于核心數(shù)量的增加,圖論是重頭戲。不斷尋找更好的連接核心的方法是必不可少的。本文重新審視了一種新穎的弦環(huán)互連拓?fù)湎到y(tǒng) Equality,以與之前的一些作品進(jìn)行比較。本文詳細(xì)介紹了構(gòu)建 Equality 互連的過程、其特殊路由過程、選擇配置的策略以及使用開源周期精確 BookSim 并評(píng)估其性能。提出了代表小型到大型計(jì)算設(shè)施的四個(gè)場景來評(píng)估網(wǎng)絡(luò)性能。這項(xiàng)工作表明,在 16,384 各端點(diǎn)系統(tǒng)中,Equality 網(wǎng)絡(luò)被證明是最有效的系統(tǒng)。結(jié)果還顯示了擴(kuò)展到 48-320K 和一百萬個(gè)端點(diǎn)的 Equality 網(wǎng)絡(luò)的穩(wěn)定可擴(kuò)展性。平等網(wǎng)絡(luò)可調(diào)整以適應(yīng)商品硬件,并在十種常見流量模型下具有彈性。建議將 Equality 網(wǎng)絡(luò)拓?fù)溆糜跇?gòu)建高效的 multi-exaflops 超級(jí)計(jì)算機(jī)和數(shù)據(jù)中心。

 

介紹

高性能計(jì)算(HPC)是一種使用高端計(jì)算組件來協(xié)同處理普通計(jì)算機(jī)無法輕易解決的大規(guī)模任務(wù)的計(jì)算類型。計(jì)算組件通過 HPC 網(wǎng)絡(luò)連接,以實(shí)現(xiàn)更高的效率。

 

HPC 網(wǎng)絡(luò)與其他網(wǎng)絡(luò)的不同之處在于,它通常尋求同步通信和計(jì)算,以便通信不會(huì)過多地中斷計(jì)算以提高效率。HPC 網(wǎng)絡(luò)還傾向于使用同類計(jì)算硬件,例如在整個(gè)實(shí)施過程中使用相同型號(hào)的交換機(jī)(具有相同數(shù)量的端口)、CPU 和加速器。由于大規(guī)模生產(chǎn),系統(tǒng)中的同質(zhì)產(chǎn)品確保每個(gè)組件的價(jià)格更低,并且在某些部件出現(xiàn)問題時(shí)通過及時(shí)更換來更直接地恢復(fù)。

 

黃等人。與一些流行的 HPC 網(wǎng)絡(luò)拓?fù)洌ɡ?2 層胖樹、3 層胖樹、3D 環(huán)面和 5D 環(huán)面)相比,已經(jīng)展示了平等網(wǎng)絡(luò)的潛力。在這項(xiàng)工作中,我們進(jìn)一步分析了不同規(guī)模的 Equality 網(wǎng)絡(luò)的性能,以與 Slim Fly、Dragonfly 和兩種流行的網(wǎng)絡(luò)拓?fù)?Fat-tree 和 Tori 進(jìn)行比較。我們還擴(kuò)展了對(duì)應(yīng)用 Equality 網(wǎng)絡(luò)的關(guān)注,以使機(jī)器能夠根據(jù)當(dāng)前的硬件工藝達(dá)到 multi-exaflops。

 

當(dāng)前工作不同于以往工作的主要貢獻(xiàn)包括:

 

平等網(wǎng)絡(luò)系統(tǒng)路由表的開發(fā)和實(shí)施,

 

修改后的路由算法 bottleneck-UGAL 避免過度訂閱路徑,

 

除了二分帶寬外,還介紹了一種稱為二分比的新度量,

 

對(duì)各種規(guī)模的 Equality 網(wǎng)絡(luò)的結(jié)果網(wǎng)絡(luò)屬性(直徑、平均距離、延遲和吞吐量)的分析以及與其他現(xiàn)有出版物的比較,

 

利用 Equality 網(wǎng)絡(luò)拓?fù)錇槲磥?HPC 系統(tǒng)尋找合適配置的策略,以及