你的位置:首頁(yè) > 互連技術(shù) > 正文

為什么存儲系統的性能對AI工作負載至關(guān)重要?

發(fā)布時(shí)間:2024-09-11 責任編輯:lina

【導讀】數據是各種現代企業(yè)的生命線(xiàn),而數據存儲、訪(fǎng)問(wèn)與管理策略對企業(yè)的生產(chǎn)力、盈利能力以及競爭力會(huì )產(chǎn)生顯著(zhù)影響。隨著(zhù)人工智能(AI)的興起,各行各業(yè)都在經(jīng)歷變革,企業(yè)不得不重新思考如何利用數據來(lái)加速創(chuàng )新和增長(cháng)。然而,AI訓練和推理對數據管理和存儲提出了獨特的挑戰,因為它們需要處理龐大的數據,同時(shí)要求高性能、可擴展性和高可用性。


為什么存儲系統的性能對AI工作負載至關(guān)重要?


數據是各種現代企業(yè)的生命線(xiàn),而數據存儲、訪(fǎng)問(wèn)與管理策略對企業(yè)的生產(chǎn)力、盈利能力以及競爭力會(huì )產(chǎn)生顯著(zhù)影響。隨著(zhù)人工智能(AI)的興起,各行各業(yè)都在經(jīng)歷變革,企業(yè)不得不重新思考如何利用數據來(lái)加速創(chuàng )新和增長(cháng)。然而,AI訓練和推理對數據管理和存儲提出了獨特的挑戰,因為它們需要處理龐大的數據,同時(shí)要求高性能、可擴展性和高可用性。


存儲系統的性能各異,受多種因素影響。在這篇博客文章中,我們將探討影響存儲系統在A(yíng)I領(lǐng)域的表現的幾大因素,并重點(diǎn)分析所選用的基礎存儲介質(zhì)將如何影響這些性能因素。


AI工作負載的關(guān)鍵屬性


AI工作負載具有數據密集和計算密集的雙重特性,這意味著(zhù)它們需要高速、低延遲地處理大量數據。存儲在支持AI工作負載高效且有效地訪(fǎng)問(wèn)、攝取、處理和存儲數據方面發(fā)揮著(zhù)關(guān)鍵作用。典型AI工作負載對存儲要求產(chǎn)生影響的幾個(gè)關(guān)鍵屬性包括:

·數據多樣性:AI工作負載需要從多個(gè)來(lái)源訪(fǎng)問(wèn)數據,數據格式包括結構化、非結構化和半結構化,同時(shí)這些數據位于不同的位置(如本地、云端或邊緣設備)。存儲解決方案需要確保在不同環(huán)境和平臺之間實(shí)現快速且可靠的數據訪(fǎng)問(wèn)和傳輸。


·數據速度:AI工作負載需要實(shí)時(shí)或近實(shí)時(shí)地處理數據。存儲解決方案需要確保在數據攝取、處理和分析過(guò)程中,實(shí)現高吞吐量、低延遲,以及穩定一致的性能。


·數據量:由于A(yíng)I模型越來(lái)越復雜、準確性越來(lái)越高,GPU集群計算能力不斷增長(cháng),其存儲解決方案也需要提供靈活且可擴展的容量和性能。


·數據可靠性和可用性:AI工作負載必須確保數據的完整性、安全性以及非常高的可用性,尤其是在與大型GPU集群相連時(shí),這些集群不能容忍數據訪(fǎng)問(wèn)發(fā)生中斷,因此相應的要求也越高。


影響存儲系統性能的因素


存儲系統性能并非單一指標,而是多個(gè)因素的組合,取決于數據、應用程序和數據中心基礎設施的特性和要求。其中包括以下幾大重要因素:

·吞吐量:從存儲系統到網(wǎng)絡(luò )或主機,以及從網(wǎng)絡(luò )或主機到存儲系統的數據傳輸速率。提高吞吐量可以改善系統性能,方法是增加帶寬以及減少數據流中的擁塞和瓶頸。吞吐量通常受網(wǎng)絡(luò )寬帶或存儲介質(zhì)速度的影響。

·延遲:存儲系統對讀寫(xiě)請求的響應時(shí)間。低延遲可以改善性能,方法是減少GPU空閑時(shí)間以及提高系統對用戶(hù)輸入的響應能力。機械設備(如HDD)的延遲本質(zhì)上要遠高于固態(tài)設備(SSD)。


·可擴展性:存儲系統對數據量、數據速度和數據多樣性的適應能力。高可擴展性是確保存儲系統能夠隨著(zhù)業(yè)務(wù)需求和目標實(shí)現增長(cháng)和演進(jìn)的關(guān)鍵。在增加系統能夠存儲和管理的數據量方面,面臨的嚴苛挑戰是維持性能擴展,同時(shí)不觸及瓶頸或存儲設備的限制。


·復原力:存儲系統在遭遇故障、錯誤或災難時(shí)維護數據完整性和可用性的能力。更高的可靠性可以通過(guò)降低數據損壞、丟失以及恢復的頻率和影響來(lái)提高性能。


其他存儲介質(zhì)


在數據中心應用中,機械硬盤(pán)(HDD)和固態(tài)硬盤(pán)(SSD)是兩種主要的持久存儲設備。HDD是機械設備,通過(guò)旋轉的磁盤(pán)盤(pán)片(表面涂有一層磁性材料)來(lái)存儲數據,而SSD通過(guò)固態(tài)閃存芯片來(lái)存儲數據。幾十年來(lái),HDD一直都是主導的存儲設備。HDD的每位成本很低,同時(shí)具有長(cháng)期斷電耐用性,但是在速度和可靠性方面不及SSD。SSD具有高吞吐量、低延遲、高可靠性,以及更密集的封裝選項等特點(diǎn)。


隨著(zhù)技術(shù)的不斷進(jìn)步和計算需求的日益增加,HDD的機械性質(zhì)確實(shí)讓其在性能上無(wú)法與SDD比肩。系統設計可以采用以下幾種方法來(lái)提升基于HDD的存儲系統的有效性能,例如將熱數據和冷數據混合存放(讓熱數據從冷數據中借用性能),在多個(gè)HDD磁盤(pán)中并行共享數據(提高吞吐量但不降低延遲),在HDD中預留冗余容量(本質(zhì)上是針對IO進(jìn)行預置,而不是增加容量),以及為延遲異常的請求或操作添加SSD緩存層。從成本效益的角度來(lái)看,這些系統級解決方案的能力只能在有限的范圍內擴展。實(shí)際應用需要怎樣的性能水平,這些解決方案就需要進(jìn)行相應擴展,才能滿(mǎn)足性能要求。對于目前的許多AI 工作負載而言,基于HDD的系統在性能可擴展性和功率效率方面存在不足。


基于SSD的大容量存儲系統可以提供一種更為簡(jiǎn)潔且可擴展性更強的解決方案,并且它們正在迅速發(fā)展,在許多以GPU為中心的大型數據中心中,已成為高性能AI數據湖的存儲介質(zhì)。單從驅動(dòng)器層面來(lái)看,SSD(基于每位成本)的成本要高于HDD。而從系統層面整體來(lái)看,如果考慮到以下改進(jìn),則與HDD相比,使用SSD構建的系統運營(yíng)成本要低一些:

·更高的吞吐量

·延遲降低100倍以上

·每PB字節所需的服務(wù)器和機架數量更少

·可靠性更高,使用壽命更長(cháng)

·在給定的性能水平下,能源效率更高 


未來(lái)幾年,SSD的容量有望突破120TB。隨著(zhù)容量的增加以及SSD與HDD之間價(jià)格差距的縮小,對于需要高于平均性能或在大數據集上需要極低延遲的其他工作負載(比如視頻剪輯和醫療成像診斷)來(lái)說(shuō),這些SSD將是具有吸引力的替代方案。

(文章來(lái)源:Micron美光科技,作者:Currie Munce,美光存儲部門(mén)高級技術(shù)顧問(wèn)和戰略專(zhuān)家)


免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。


推薦閱讀:

第4講:SiC的物理特性

邊界工況推動(dòng)下,汽車(chē)圖像傳感器的四大發(fā)展方向

氮化鎵在高壓應用中提供強大的解決方案

在使用快速共模和隔離探頭進(jìn)行浮動(dòng)測量

開(kāi)關(guān)模式電源問(wèn)題分析及其糾正措施:檢測電阻器違規

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書(shū)下載更多>>
熱門(mén)搜索
?

關(guān)閉

?

關(guān)閉

久久无码人妻精品一区二区三区_精品少妇人妻av无码中文字幕_98精品国产高清在线看入口_92精品国产自产在线观看481页