設計工具

輸入無效。不支援特殊字元。

洞察

從資料到決策:SSD 寫入快取為何對 AI 應用至關重要

Josh Goltermann | 2025 年 6 月

pause

想像一下,您是一位繁忙的上班族:每當有人給您傳送電子郵件——即使是無關緊要的任務——您必須停下手頭的工作並立即回覆。這些干擾不僅會分散您的注意力,降低您的工作效率,還會擾亂您的日程安排。沒有寫入快取,電腦會經常面臨任務中斷。

SSD 寫入快取可提升 AI 所需的 SSD 速度

自1980年代起,寫入快取一直是儲存系統的一項重要功能,1該功能最早應用於傳統硬碟(HDD),並在 RAID 配置與企業系統中採用回寫快取(write-back)和直寫快取(write-through)等技術。回寫快取將資料臨時儲存在高速記憶體中,然後再寫入磁碟,這一過程可縮短完成寫入操作的時間,進而提升效能。

隨著固態硬碟(SSD)和現代 NAND 架構的出現,寫入快取有了顯著發展。現在,寫入快取在減少寫入放大(由於資料重組和垃圾收集等內部流程,硬碟最終寫入比使用者請求更多的資料)、在高輸入/輸出(I/O)負載下保持高吞吐量,以及支援即時資料處理方面發揮著關鍵作用。

SSD 動態寫入快取會在高速記憶體(通常為 DRAM 或 SLC 快取)中臨時儲存寫入操作,隨後再將其寫入較慢的 NAND 快閃記憶體。這一過程可加快寫入確認速度、減少延遲並提高系統回應速度——這些優勢在人工智慧(AI)等資料密集型環境中更為關鍵。與靜態或固定快取不同,動態寫入快取會根據工作負載模式即時調整快取使用,進而最佳化效能和耐用性。

有了寫入快取,AI 執行速度更快(並且更智慧)

寫入快取可最佳化 AI 的多種使用案例和優勢,包括 AI 訓練、推理延遲、大型語言模型效率以及邊緣和分散式環境。

AI 模型訓練:AI 訓練工作負載需要持續的吞吐量和最小的延遲,特別是對於大規模資料集和複雜的神經網路架構。寫入快取透過加快資料存取速度和減少延遲增強這些工作負載,最大限度地減少 I/O 瓶頸。此最佳化對於在不同儲存層級上保持效能和可擴充性至關重要。

Micron 9550 SSD 與 NVIDIA® H100 GPU 搭配使用,吞吐量提高了 60%,使圖形神經網路訓練的速度提升了 33%。這一提升還使 SSD 的能耗降低了 43%,系統總能耗降低了 29%。²

在 Unet3D 醫學圖像分割工作負載(來自 MLPerf Storage 基準測試)中,使用相同 SSD 的效能提高了 5%,平均功耗降低了 32%,相當於 SSD 能耗降低了 35%。²

推理延遲最佳化:想像一下,向語音助手提問,需要等待幾分鐘才能得到回覆。這種延遲通常由資料存取速度過慢引起。減少推理延遲對於要求即時回應的 AI 應用的成功至關重要。無論是對話式 AI、詐欺檢測還是自主決策,最大限度地減少延遲能夠確保及時、準確的輸出,並增強使用者體驗和系統可靠性。SSD 寫入快取透過加速資料存取、有效管理寫入和最佳化系統效能,在此過程中發揮至關重要的作用。

GATI 預測服務系統整合學習快取層,將現實 AI 工作負載的端到端推理延遲減少 7.69 倍。³

大型語言模型效率:GPT 和 LLaMA 等 LLM 需要高記憶體頻寬以快速有效率處理大量資料。然而,在商用或記憶體受限的硬體上執行這些模型頗具挑戰性——缺少快速儲存會導致效能瓶頸。SSD 寫入快取將頻繁存取的資料暫時儲存在高速記憶體中,進而降低延遲,確保在效能較弱的系統上也能進行推理。

M2Cache 是一種混合精度、多層級快取框架,本身利用 DRAM 和 SSD 管理大量模型參數,實現可擴充的 LLM 推理,並最小化效能降幅。 

邊緣 AI 和分散式環境:在邊緣運算中,由於硬體限制和本地化推理需求,寫入快取變得更加重要。邊緣裝置(如智慧攝像頭、輕薄筆記型電腦和車載裝置)的記憶體和處理能力通常有限,因此處理大型資料集和複雜運算具有挑戰性。快速存取本地資料以實現即時決策至關重要。快取可將頻繁存取的資料臨時儲存在更靠近邊緣的位置,進而減少延遲,提高即時資料處理和推理任務的效率。

將 Redis 作為分散式快取與 NVIDIA Triton 推理伺服器配合使用,推理吞吐量從每秒 80 次增加到 329 次,延遲從 12,680 微秒減少到 3,030 微秒——吞吐量增加了四倍,延遲減少了四倍。

SSD 寫入快取助力 AI

從智慧型手機到自駕車,您會發現 AI 無處不在——其速度取決於資料存取速度。

寫入快取對 AI 的發展非常關鍵,能確保模型有效擴展並順暢運作。SSD 寫入快取對於保持高 I/O 吞吐量,實現即時邊緣智慧,提高能源效率和最佳化多代理系統效能至關重要。透過減少瓶頸、克服硬體限制、降低功耗和提供快速本地快取存取,SSD 寫入快取成為即時、高效率和可擴充的次世代 AI 系統的關鍵推動因素。

深入瞭解美光 SSD

1. Anderson, D.(2001 年)。《儲存架構入門》。IBM Redbooks。摘自 https://www.redbooks.ibm.com/redbooks/pdfs/sg246363.pdf
2. Micron Technology。(2024 年)。使用 Micron 9550 SSD,以更低的功耗更快地完成 AI 工作負載。摘自 https://my.micron.com/about/blog/storage/ai/complete-ai-workloads-faster-using-less-power-with-the-micron-9550-ssd  }
3. Harlap, A. 以及其他人。(2021 年)。《GATI:基於學習的推理快取》,arXiv 預印本。摘自 https://arxiv.org/abs/2101.07344
4. Wang, Y. 以及其他人。(2024 年)。《M2Cache:混合精度與多層級快取技術提升 LLM 推理效率》,arXiv 預印本。摘自 https://arxiv.org/abs/2410.14740
5. Serverion。(2024 年)。《AI 工作負載的七大資料快取技術》。摘自 https://www.serverion.com/uncategorized/top-7-data-caching-techniques-for-ai-workloads  

PC Client Marketing Strategy and Content Lead

Joshua Goltermann

As the PC client marketing strategy and content lead, Josh is responsible for Micron’s memory and storage portfolio for the PC-client segment. He has directed launches related to Micron’s storage portfolio, including the 6550 ION and 4600 SSD. Prior to marketing, Josh spent 10 years working on understanding client SSD performance.

Josh holds degrees in information technology management and marketing from Boise State University.