設計工具
儲存裝置

HDD 與 SSD:探討的重點是什麼?

Steve Wells - 2024 年 4 月

技術更新換代是耳熟能詳的故事——新舊火炬的交替。舉例來說,蒸汽機被內燃機取代,笨重的電子管顯示器黯然退場,取而代之的是時尚的 LCD 螢幕。我最關心的技術交替是筆記型電腦中的固態硬碟 (SSD) 幾乎完全取代傳統硬碟 (HDD)。

我從事快閃記憶體和基於快閃記憶體的 SSD 架構和研發工作已有三十多年,對儲存技術的轉變非常瞭解。我見證了 SSD 的關鍵轉變——從 NOR 到 NAND,從每單元一位元 (SLC) 到每單元多位元(MLC、TLC、PLC 等),從 SATA 到 PCIe/NVMe,以及從 2.5 吋 HDD 規格尺寸到 M.2 和 EDSFF 等專用 SSD 規格尺寸的轉變。每項轉變都對整個產業產生重大影響,並推動我們向前邁進。

一個始終存在的突出問題是:SSD 的成本效益何時能超過 HDD,並完全取代 HDD?根據 IDC 的資料1,與容量最佳化的 HDD(主要是 20TB 3.5 吋)相比,2023 年出貨至資料中心的以 PB 計算的硬碟中約有 13% 是快閃記憶體 SSD(主要是 TLC)。SSD 的每 TB 美元年均複合增長率約為 17%,而容量最佳化的 HDD 的年均複合增長率為 8.5%,因此可以預測 10-15 年後會出現理論上的交叉。

在本部落格中,我將探討一個更值得提出的問題,並對資料儲存的未來做出預測。我將以 Currie Munce 最近發表的一篇美光部落格為基礎,討論一個超大規模資料中心從嚴格基於 HDD 的暖層檔案系統進行過渡的經驗,以及 AI 對他們和解決方案(包括作為分層快取層的 SSD)的影響。

從 Meta 暖層過渡到由 AI 驅動的 SSD/HDD 複合解決方案

2021 年,Meta 在 Usenix 檔案和儲存技術大會上展示了 Tectonic 檔案系統3。這一創新系統將低延遲、以 IOPS 為優先並可按要求快速配置 HDD 的小尺寸 blob 儲存裝置,與資料倉儲相結合,可提供以容量為優先的 HDD。Tectonic 作為統一的艾位元組級系統運作,由數千個儲存節點組成,每個機架裝有 72 個 3.5 吋 HDD。儲存節點基於容量最佳化的 3.5 吋 HDD。

一切都很順利,直到 AI 對儲存裝置的需求急劇增加,使得其線上攝取頻寬在大約一年的時間裡增加了四倍!這超過了 100% HDD 解決方案的峰值 I/O 需求。

圖 1:由於 AI 的爆炸式增長,Meta 的頻寬需求在 4 個季度內增長了 4 倍

如果繼續使用純 HDD 的暖層,則需要為 I/O 大量超額配置硬碟,最終導致專用儲存容量過剩,成本和功耗過高。他們將上述方案與使用 100% SSD 替換暖層或採用 HDD 和 SSD 複合解決方案的選項進行了比較。Meta 發佈的下表說明了他們所面臨的挑戰:僅使用 HDD 會出現嚴重的超額配置,僅在當前容量下使用 SSD 進行替換的困難度很高,而 HDD 和快閃記憶體的複合儲存解決方案則能實現理想的平衡。

表 1:假設儲存容量和 IO 需求分別為 100 PB 和 10 TB/s,HDD、快閃記憶體和理想複合叢集的儲存功耗要求。Meta 顯示了滿足僅儲存、僅頻寬和兩種要求所需的功耗,並規範化為 HDD 僅儲存。4

建構正確的儲存快取

修訂後的暖層解決方案被命名為 Tectonic-Shift。它包括一個對應用透明的 TLC 快取記憶體,支援已在暖層中的 HDD。在 ACM '234 發表的文章中,有許多關於作者如何在詳細分析 AI 軌跡及其獨特特性後選擇快取政策,以及如何在插入與驅逐政策之間做出正確的取捨,並在暖層快取記憶體中的 SSD 的效能、成本與耐用性之間進行權衡的討論。

由於 AI 工作負載的激增,Meta 基於 HDD 的 Tectonic-Shift 系統插入了 SSD 快取層,從而吸收了增加的工作負載。

圖 2:將 Shift 與僅接受 IO 繁重資料表的專家手動調優策略進行比較的生產結果。

超越 AI 的複合式 SSD+HDD。展望未來。

關鍵的權衡不僅在於實現合適的儲存密度,還在於確保該密度具有合適的 I/O 效能。正如 Currie Munce 之前在部落格中所討論的,效能除以密度是一個值得考慮的實用指標。讓我們舉例說明:在「Facebook 的 Tectonic 檔案系統:百萬兆級的效率」一文中,作者提出了一個複合叢集,需要以每秒 10 TB 的峰值速率執行 100 PB。這意味著在峰值效能下,儲存吞吐密度約為每 TB 每秒 100 MB(MB/s/TB)。不過,不同工作負載的平均要求有所不同。對於 AI 工作負載,建議的平均儲存密度約為 20 MB/s/TB,而物件儲存的執行速度通常約為 5 MB/s/TB。另一方面,Blob 儲存則徘徊在 2 MB/s/TB 左右2

在不斷發展的資料儲存領域,平衡效能和密度變得至關重要。

美光 6500 ION 專為暖層而生

雖然 HDD 的密度年複合增長率令人印象深刻,但其效能卻近乎持平。因此,每 TB 每秒百萬位元組 (MB/s/TB) 會隨著每一代產品的推出而降低。美光認為,與 HDD 超額配置相比,透過進一步 SSD 分層可以解決該問題。SSD 將取代暖層中的 HDD。HDD 將繼續服務於低溫層/冷層。

因此,正確的問題是:

「SSD 何時才能在資料中心中真正取代(而不是替代)HDD?」

答案是:

「它們已經取代了!」

這正是美光研發並推出美光 6500 ION SSD 的原因。這款屢獲殊榮的 SSD 透過高吞吐密度、功耗效率和低延遲,最佳化了分層儲存解決方案的總體擁有成本 (TCO)。

在可預見的未來,它將成為 HDD 的補充層,而不是 HDD 的替代品。

 

參考資料

IDC,《2023-2027 年全球固態硬碟預測更新,2023 年 12 月》|文件編號:US50021623;IDC,《2023-2027 年全球硬碟預測更新,2023 年 12 月》|文件編號:US51423423
SSD 與 HDD——「是敵是友」
3Tectonic 檔案系統:整合儲存基礎架構——Meta 工程 (fb.com)
Tectonic-Shift:用於大規模 ML 訓練的複合儲存結構 | USENIX

Fellow, Architect Storage Systems

Steven Wells

Steven Wells is a Fellow at Micron, focusing on next generation SSD solutions with over 65+ patents in the area of non-volatile storage. He has been involved in flash component and SSD design since 1987 and has published at multiple conferences including ISSCC, JSSC, Flash Memory Summit, Storage Developer Conference, and OCP Global Summit and serves as a board member of NVM Express.