- US - English
- China - 简体中文
- India - English
- Japan - 日本語
- Malaysia - English
- Singapore - English
- Taiwan – 繁體中文
輸入無效。不支援特殊字元。
想像一下,您是一位繁忙的上班族:每當有人給您傳送電子郵件——即使是無關緊要的任務——您必須停下手頭的工作並立即回覆。這些干擾不僅會分散您的注意力,降低您的工作效率,還會擾亂您的日程安排。沒有寫入快取,電腦會經常面臨任務中斷。
SSD 寫入快取可提升 AI 所需的 SSD 速度
自1980年代起,寫入快取一直是儲存系統的一項重要功能,1該功能最早應用於傳統硬碟(HDD),並在 RAID 配置與企業系統中採用回寫快取(write-back)和直寫快取(write-through)等技術。回寫快取將資料臨時儲存在高速記憶體中,然後再寫入磁碟,這一過程可縮短完成寫入操作的時間,進而提升效能。
隨著固態硬碟(SSD)和現代 NAND 架構的出現,寫入快取有了顯著發展。現在,寫入快取在減少寫入放大(由於資料重組和垃圾收集等內部流程,硬碟最終寫入比使用者請求更多的資料)、在高輸入/輸出(I/O)負載下保持高吞吐量,以及支援即時資料處理方面發揮著關鍵作用。
SSD 動態寫入快取會在高速記憶體(通常為 DRAM 或 SLC 快取)中臨時儲存寫入操作,隨後再將其寫入較慢的 NAND 快閃記憶體。這一過程可加快寫入確認速度、減少延遲並提高系統回應速度——這些優勢在人工智慧(AI)等資料密集型環境中更為關鍵。與靜態或固定快取不同,動態寫入快取會根據工作負載模式即時調整快取使用,進而最佳化效能和耐用性。
有了寫入快取,AI 執行速度更快(並且更智慧)
寫入快取可最佳化 AI 的多種使用案例和優勢,包括 AI 訓練、推理延遲、大型語言模型效率以及邊緣和分散式環境。
AI 模型訓練:AI 訓練工作負載需要持續的吞吐量和最小的延遲,特別是對於大規模資料集和複雜的神經網路架構。寫入快取透過加快資料存取速度和減少延遲增強這些工作負載,最大限度地減少 I/O 瓶頸。此最佳化對於在不同儲存層級上保持效能和可擴充性至關重要。
Micron 9550 SSD 與 NVIDIA® H100 GPU 搭配使用,吞吐量提高了 60%,使圖形神經網路訓練的速度提升了 33%。這一提升還使 SSD 的能耗降低了 43%,系統總能耗降低了 29%。²
在 Unet3D 醫學圖像分割工作負載(來自 MLPerf Storage 基準測試)中,使用相同 SSD 的效能提高了 5%,平均功耗降低了 32%,相當於 SSD 能耗降低了 35%。²
推理延遲最佳化:想像一下,向語音助手提問,需要等待幾分鐘才能得到回覆。這種延遲通常由資料存取速度過慢引起。減少推理延遲對於要求即時回應的 AI 應用的成功至關重要。無論是對話式 AI、詐欺檢測還是自主決策,最大限度地減少延遲能夠確保及時、準確的輸出,並增強使用者體驗和系統可靠性。SSD 寫入快取透過加速資料存取、有效管理寫入和最佳化系統效能,在此過程中發揮至關重要的作用。
GATI 預測服務系統整合學習快取層,將現實 AI 工作負載的端到端推理延遲減少 7.69 倍。³
大型語言模型效率:GPT 和 LLaMA 等 LLM 需要高記憶體頻寬以快速有效率處理大量資料。然而,在商用或記憶體受限的硬體上執行這些模型頗具挑戰性——缺少快速儲存會導致效能瓶頸。SSD 寫入快取將頻繁存取的資料暫時儲存在高速記憶體中,進而降低延遲,確保在效能較弱的系統上也能進行推理。
M2Cache 是一種混合精度、多層級快取框架,本身利用 DRAM 和 SSD 管理大量模型參數,實現可擴充的 LLM 推理,並最小化效能降幅。⁴
邊緣 AI 和分散式環境:在邊緣運算中,由於硬體限制和本地化推理需求,寫入快取變得更加重要。邊緣裝置(如智慧攝像頭、輕薄筆記型電腦和車載裝置)的記憶體和處理能力通常有限,因此處理大型資料集和複雜運算具有挑戰性。快速存取本地資料以實現即時決策至關重要。快取可將頻繁存取的資料臨時儲存在更靠近邊緣的位置,進而減少延遲,提高即時資料處理和推理任務的效率。
將 Redis 作為分散式快取與 NVIDIA Triton 推理伺服器配合使用,推理吞吐量從每秒 80 次增加到 329 次,延遲從 12,680 微秒減少到 3,030 微秒——吞吐量增加了四倍,延遲減少了四倍。⁵
SSD 寫入快取助力 AI
從智慧型手機到自駕車,您會發現 AI 無處不在——其速度取決於資料存取速度。
寫入快取對 AI 的發展非常關鍵,能確保模型有效擴展並順暢運作。SSD 寫入快取對於保持高 I/O 吞吐量,實現即時邊緣智慧,提高能源效率和最佳化多代理系統效能至關重要。透過減少瓶頸、克服硬體限制、降低功耗和提供快速本地快取存取,SSD 寫入快取成為即時、高效率和可擴充的次世代 AI 系統的關鍵推動因素。
1. Anderson, D.(2001 年)。《儲存架構入門》。IBM Redbooks。摘自 https://www.redbooks.ibm.com/redbooks/pdfs/sg246363.pdf
2. Micron Technology。(2024 年)。使用 Micron 9550 SSD,以更低的功耗更快地完成 AI 工作負載。摘自 https://my.micron.com/about/blog/storage/ai/complete-ai-workloads-faster-using-less-power-with-the-micron-9550-ssd }
3. Harlap, A. 以及其他人。(2021 年)。《GATI:基於學習的推理快取》,arXiv 預印本。摘自 https://arxiv.org/abs/2101.07344
4. Wang, Y. 以及其他人。(2024 年)。《M2Cache:混合精度與多層級快取技術提升 LLM 推理效率》,arXiv 預印本。摘自 https://arxiv.org/abs/2410.14740
5. Serverion。(2024 年)。《AI 工作負載的七大資料快取技術》。摘自 https://www.serverion.com/uncategorized/top-7-data-caching-techniques-for-ai-workloads