設計工具

輸入無效。不支援特殊字元。

資料中心

堆疊解決方案:美光 SSD 和 DDR5、Intel Xeon 和 Supermicro 打破 25 項 STAC-M3 Bechtel 世界紀錄

Ryan Meredith,Kevin Gildea(Intel 貴賓) | 2025 年 10 月

Intel®、Micron Sonata 和 Supermicro® 隆重宣布:我們在 STAC-M3 基準測試中,一舉打破了 25 項,沒錯,25 項,新的世界紀錄!STAC-M3 是一套業界標準的金融企業點滴分析基準,適用於管理大型時間序列市場資料(「點滴資料」)的資料庫軟體和硬體堆疊。將測試組織成基線測試(名為 Antuco)和較大的縮放測試(名為 Kanaga)。

該破紀錄的解決方案採用 Intel 6767P Xeon 6 processor、Micron 9550 NVMe SSDMicron 128GB DDR5 RDIMMSupermicro SSG-222B-NE3X24R Petascale 伺服器,效能優於所有公開揭露的報告,並在以下方面設定了 25 項新的效能記錄:

  • 24 個 Kanaga 平均回應時間基準中的 19 個,包括 10 個 Kanaga 50 使用者和 100 使用者基準中的全部 10 個
  • 5 個 Kanaga 輸送量基準中的 3 個
  • Antuco 50 位使用者和 100 位使用者基準中的 3 個

在本部落格中,我們將著重於 Kanaga 和 Antuco 中規模最高的測試,以遠低於先前記錄持有人的硬體展現驚人的效能。

6 個 Supermicro SSG-222B-NE3X24R Petascale 伺服器節點 圖 1:6 個 Supermicro SSG-222B-NE3X24R Petascale 伺服器節點

(按一下放大圖片)

系統架構

在深入探討結果之前,讓我們看看受測系統:

我們使用了 6 個 Supermicro SSG-222B-NE3X24R Petascale 伺服器,叢集超過 400GbE。每個伺服器都有:

  • 2x Intel Xeon 6767P 處理器,每個 64 核心,每個節點 128 核心計算,共 768 核心
  • 16x 128GB 美光 DDR5 DRAM,每個節點 2TB 記憶體,總計 12TB
  • 24x 12.8TB Micron 9550 NVMe SSD,每個節點 307.2TB 儲存空間,總計 1,843TB
  • 2 個 400GbE ConnectX-7 SmartNIC、每個節點 100GB/s 網路輸送量、總計 600GB/s

該解決方案在 KX 軟體的 kdb+ 4.1 上執行,並隨附 STAC-M3 Pack for kdb+。

STAC-M3 基準套件

分析時間序列資料,例如逐個勾選和交易記錄,對於從演算法開發到風險管理等各種功能而言至關重要。但是,透過自動化交易,尤其是高頻策略,現在主導市場,此類分析已經變得更加重要和複雜。隨著交易機器人嘗試以微秒或亞微秒的規模相互超越,他們引出報價並以更令人印象深刻的量進行交易。這使得技術變得非常出色,可以高效快速地儲存和分析該活動。

STAC 基準委員會已制定 STAC-M3 基準,為量化新興軟體、雲端和硬體創新改善市場資料時間序列 (「點滴」) 資料儲存、檢索和分析效能的程度提供了共同的基礎。

STAC-M3 根據工作負載大小分為兩套基準:

  • 安圖哥:旨在測量單一節點效能的較小規模基準
  • 卡納加:Antuco 的擴充版本,將對大型硬體部署造成壓力

雖然我們的 STAC-M3 報告包括基準套件和所有測試的詳細結果,但我們將把重點放在本部落格中最大資料集大小的 Kanaga 結果。

STAC-M3 從小型資料集開始,然後逐年擴充,使用每年 1.6 倍的資料集大小,持續 5 年。「 第 5 年」資料集代表測試中最大的資料集大小,對解決方案來說是最困難的。STAC-M3 基準使用毫秒內之延遲作為測試結果之量測單位;因此,較低結果較佳。

解決方案比較

STAC-M3 在許多硬體配置上進行測試;元件的選擇取決於設計受測系統的架構師。對於我們的解決方案,我們專注於三個主要驅動因素:

  • 容量:我們能否超越需要更大硬體佔用空間的解決方案?
  • 總體擁有成本(TCO): 我們的解決方案是否具有成本效益且尺寸適當?
  • 可擴充性: 我們的解決方案能否擴展到通過測試的設定?
表 1:STAC-M3 與先前記錄持有人的績效比較 表 1:STAC-M3 與先前記錄持有人的績效比較

(按一下放大圖片)

我們比較了我們的解決方案與最後三份已發佈的 STAC-M3 報告:

  • RU 的足跡最小:12RU 相較於 21RU 至 44RU
  • 我們使用第二少的 CPU 核心:768 個核心與 384 至 2,048 個核心
  • 我們擁有最高的儲存容量:1.6PiB (相當於 1.8PB) 相較於 84TiB 至 266TiB
  • 我們擁有最高的記憶體容量:12TB 相較於 4TB 至 8TB

如您所見,我們的解決方案以更小的解決方案足跡,遠遠超越以往的記錄持有者。

結果:不同間隔的高出價

5YRHIBID 使用單一執行緒來傳回資料集內特定年份範圍內,每個 1% 符號的最高出價。5YRHIBID 的範圍是從 2011 年第一天到 2015 年最後一天。這是一個具有輕量演算法運算強度的讀取密集型工作負載。

圖表 1:STAC-M3 Kanaga,第 5 年平均和體積調整後反應時間相較於先前記錄持有人 圖表 1:STAC-M3 Kanaga,第 5 年平均和體積調整後反應時間相較於先前記錄持有人

(按一下放大圖片)

反應時間大幅改善

我們的 STAC-M3 解決方案平均反應時間減少了 70%,體積調整反應時間也比下一個最佳分數減少了 89%。容積調整後的回應時間會將回應時間標準化,以查看每個報價或交易的回應時間如何隨著資料集的大小而改變。請注意,上述圖形為對數尺度。

回應時間大幅縮短的一個原因是美光 9550 NVMe SSD 讓儲存輸送量大幅增加。

密度:大幅提升儲存效能

圖表 2:STAC-M3 Kanaga,5 年高出價,以 GB/s 為單位,以不同間隔的儲存輸送量與先前記錄的持有者比較 圖表 2:STAC-M3 Kanaga,5 年高出價,以 GB/s 為單位,以不同間隔的儲存輸送量與先前記錄的持有者比較

(按一下放大圖片)

我們的解決方案的儲存效能是下一次最接近測試的 2.5 倍,體積更小。

結果:無法預測的間隔統計資料

STATS-UI:每個使用者查詢一個交換、日期和開始時間的獨特組合,然後在 100 分鐘範圍內每分鐘交換一次上返回所有大量符號的基本統計資訊。開始時間會從分鐘邊界隨機偏移,且所有範圍都會跨越日期邊界。此工作負載是讀取密集型和演算法運算密集型。測試旨在測量負載增加時的效能,特別是在 50 位使用者和 100 位使用者層級,代表高並行率情境。

速度:以高並行率處理運算和讀取密集型查詢時,獲得前所未有的最快結果

圖表 3:STAC-M3 Antuco,50 和 100 使用者平均回應時間相較於先前記錄持有者 圖表 3:STAC-M3 Antuco,50 和 100 使用者平均回應時間相較於先前記錄持有者

(按一下放大圖片)

與之前的記錄持有者 KDB221014 相比,我們的解決方案比以往完成計算密集型 100 使用者基準測試的速度快了 36%,同時使用了少了 62% 的 CPU 核心。我們針對 100 使用者基準測試的解決方案實現了平均回應時間,比先前記錄持有者對 50 使用者基準測試的反應時間還短。

結果:5 年市場概況

YR5-MKTSNAP:回傳特定 1% 符號在資料集指定年度內特定日期的特定時間的最新報價和交易價格和大小。YR5-MKTSNAP 查詢 2015 年最大資料集的日期和時間。此工作負載是讀取密集型和演算法運算密集型。

圖 4:STAC-M3 Kanaga,第 5 年中位數和最大反應時間相較於先前記錄持有者的快照 圖 4:STAC-M3 Kanaga,第 5 年中位數和最大反應時間相較於先前記錄持有者的快照

(按一下放大圖片)

TCO:以更少的核心和明顯更少的機架空間實現頂級效能

我們的解決方案獲得最低的反應時間中位數。雖然 KD2201014 報告有最低的最大回應時間,但測試部署了 44RU 和 2,048 個 CPU 核心,而我們的解決方案中則部署了 12RU 和 768 個 CPU 核心。相比之下,我們提供更快的中位數回應時間,減少了 62% CPU 核心,減少了 73% 的機架空間。

結果:第 5 年組織加權投標

YR5 VWAB-12D-HO:表示 12 天隨機選擇的 4 小時體積加權平均出價,變更同時請求的數量。它在 Kanaga 資料集的多年中運行,選擇日期和符號以確保請求之間的高度重疊,因為這是現實世界中常見的模式。這是一項具有光演算法運算強度的讀取密集型測試。

圖表 5:STAC-M3 Kanaga,第 5 年多日交易量加權出價相較於先前記錄持有人 圖表 5:STAC-M3 Kanaga,第 5 年多日交易量加權出價相較於先前記錄持有人

(按一下放大圖片)

這項測試至關重要;它顯示了解決方案應對使用者負載增加的能力。

擴充性:使用者擴充效能提升 10 倍

YR5 VWAB-12D-HO 的結果驚人。在 1 個用戶端執行緒中,我們的解決方案比所有發佈的報告都快上許多。它在 50 個用戶端執行緒 (高達 9.5 倍) 和 100 個用戶端執行緒 (高達 7 倍) 中保持了重要領先。

新前沿已解鎖

基準顯示真正的前沿。記錄推動了這一前沿,並重新定義了可能性,激發了集體的想像力。技術的躍進帶來速度上的劇烈提升,催生了新的應用案例,並將原先無法實現的策略轉變為現實。回顧得越快,展望得越遠。

這就是運算、記憶體和儲存裝置協調運作時所發生的事情,前沿是向前邁進的。STAC-M3 是密集型套件,可驗證解決方案是否準備好應付嚴苛的金融服務工作負載。Intel、Micron 和 Supermicro 結合資源,提供密集、可擴充的現代堆疊,不僅超越了大型配置所設定的紀錄,更大幅度地提升了效能。

您希望深入瞭解嗎?

如果您在 10 月 28 日在紐約市的 STAC 會議上發現自己,請向這項工作的建築師打招呼:

  • Kevin Gildea | Intel 解決方案架構師
  • 美光首席資料中心解決方案架構師 Jay Walstrum
  • Wendell Wenjen | Supermicro 儲存行銷開發總監
  • Ryan Meredith | 美光資料中心工作負載工程總監

資料中心工作負載工程部總監

Ryan Meredith

Ryan Meredith 是美光技術資料中心工作負載工程部總監。他領導企業和雲端儲存的工作負載驅動式工程設計,為美光的 NVMe SSD 產品組合提供涵括人工智慧(AI)、資料庫及現代資料服務的上市宣傳材料與效能證明要點。Ryan 和他的團隊側重於將應用程式行為歸化為裝置和系統要求,在實際條件下提高吞吐量、QoS 和能源效率。

Intel 解決方案架構師

特約撰稿人 Kevin Gildea

Kevin Gildea 是 Intel 的解決方案架構師,致力與全球金融和貿易公司建立工程設計夥伴關係。他最近發表的研究著重於最佳化高效能運算(HPC)和低延遲工作負載。此前,Kevin 是 Hewlett Packard Enterprise (HPE) 的主任架構師,致力與雲端服務供應商合作以推進超大規模資料中心部署、高效能運算及 AI 基礎架構。Kevin 擁有麻省理工學院理學學士學位,現居紐約市。

相關部落格