迪士尼TM 經典動畫「海底總動員」中有一句知名台詞:「魚是朋友,不是食物」。SSD 供應商總是把 HDD 視作食物,而非朋友。對於筆記型電腦而言確實是這樣。對於資料中心儲存裝置而言,SSD 和 HDD 有許多機會可成為「朋友」。
資料中心在滿足大數據分析、人工智慧和雲端運算等資料密集型應用程式的需求方面,面臨越來越大的挑戰。此類應用程式要求儲存裝置的基礎設施具備高效能、可擴充性、可靠性及成本效益。然而,傳統硬碟機(HDD)卻很難滿足此類工作負載對速度和容量的要求,而固態硬碟(SSD)仍然太昂貴,無法完全取代 HDD。資料中心應如何克服這種兩難境地,實現兩全其美?
解決方案之一就是善用 SSD 和 HDD 技術的互補優勢。資料快取和效能分層是企業儲存系統領域大家耳熟能詳的概念。一直以來,快速、非揮發性的寫入緩衝都是用於在串聯至較慢的儲存裝置之前進行聚合寫入操作。以較高的成本提供較高效能等級的資料分層,在大多數大型儲存裝置部署中均很常見。層級歷來乃由 RPM 和磁碟直徑各異的 HDD 確定。現在,高效能層級使用 SSD。舉例而言,IDC1 報告稱,在 2023 日曆年的 OEM 企業儲存系統中,混合儲存陣列(HDD + SSD)的出貨位元數,比單純的 HDD 或全快閃記憶體陣列(AFA)的出貨位元數高出近 2 倍(而 AFA 的年增長率目前最高)。
提升效能
對儲存系統而言,最重要的效能指標是資料吞吐量除以容量(通常以 MB/s / TB 表示)。如儲存裝置的容量增加,亦需要提升頻寬(MB/s)。否則,整體系統效能便會降低。儲存系統所需的效能因工作負載和系統硬體架構而異。對於若干典型的大型資料中心工作負載,所需的效能(MB/s / TB)從大型 BLOB 物件儲存的 2.5 左右,到大數據分析的 5.0 左右,再到執行 AI 模型訓練的 GPU 叢集的 20 左右不等。
對於 HDD,裝置的物理與機械性質決定其頻寬。我們可以透過限制對超大(≥ 8MB)序列資料組塊的資料存取提升 HDD 的整體吞吐量,即資料傳輸時間與尋找資料位置的記錄頭所花時間比值最大化。吞吐量的增幅受限於 HDD 的最大序列頻寬。這通常需要對輸入進行寫入緩衝,以將不同大小的主機工作負載聚合為大型組塊,並為對延遲敏感型或頻寬受限的主機讀取進行資料快取。對於 HDD,另一種方法是過度配置容量,創造「暗容量」。這種維持效能水準的方法就 HDD、伺服器╱基礎設施成本以及資料中心功耗需求而言均較昂貴。
SSD 與 HDD 的協同效應
SSD 雖然更為昂貴,但卻能提供更高的效能,是最適合此類快取的儲存裝置,可作為主機應用程式需求與 HDD 儲存子系統之間的橋樑。然而,為了實現以上 HDD 吞吐量的增幅,資料中心需要採用智慧型資料管理軟體和算法,根據資料特性、存取模式和業務優先次序,自動且動態地在資料層級和快取之間分配資料。所有資料中心並非都具備最佳化和調整管理軟體所需的精密化技術水準。只需部署一層儲存裝置便可滿足所有效能需求,這種便利性是全快閃記憶體陣列相較於混合式和單純的 HDD 存儲陣列具有較高增長率的主要原因。
此類快取和分層策略可令 HDD 的吞吐量最大化,目前除了對 HDD 容量要求最高的工作負載(高達 20TB)外,對其他所有工作負載均非常有效。隨著未來 HDD 容量增加到 30 或 40 TB,滿足工作負載效能需求將愈發困難。例如,假設一個大型資料分析應用程式需要在 40 TB HDD 上達到 5 MB/s / TB,HDD 則須提供 200 MB/s 的頻寬。即使對於先進的資料中心而言,要確保 3.5" 7200 RPM HDD 從硬碟的最外層到最內層始終維持該速度,亦是一項重大挑戰。在此類系統中,SSD 快取的相對大小和資料管理精細程度均須有所提升,因此 HDD 儲存系統對 SSD 效能優勢的依賴程度將增加。
平衡成本與效能
透過將 SSD 和 HDD 視為「朋友」,資料中心可以在儲存成本及滿足資料密集型應用程式的多樣化及動態需求方面實現最佳平衡。隨著 HDD 的容量越來越大,這種關係也會隨著時間而演變。
SSD:
- 為熱資料和延遲敏感型應用程式提供快速存取
- 可充當快取或層級,增加從 HDD 傳輸資料的頻寬
而 HDD: - 提供更具成本效益的儲存裝置($/TB)
- 對於冷資料儲存應用程式(例如歸檔或備份資料)來說,具有優越的保留屬性。
長期展望
大型 HDD 容量增幅受限,但仍能為大多數資料中心應用程式提供最具成本效益的儲存裝置。最後,對於除了冷儲存應用程式以外的所有應用程式而言,僅使用 SSD 的儲存裝置可能會比 HDD 型解決方案更便宜。我將留待日後的部落格討論。
1. IDC 企業儲存裝置追蹤季刊,2023 年第 4 季