設計工具
公司

以正確的記憶體策略啟用數位分身

Wil Florentino | 2023 年 3 月

IDC 預測,自 2021 年至 2027 年,建模為數位分身的新實體資產和處理程式的數量將從 5% 增加至 60%。雖然將資產行為的關鍵元素數位化的概念並非全新的概念,但從精確地感測到即時運算,再到從大量資料中擷取見解的改進,技術各個層面的能力都在逐漸調整,使機器和作業系統更加優化,並有助於加速擴展和上市時間。此外,啟用 AI/ML(人工智慧/機器學習)模型將有助於提高流程效率、減少產品錯誤並提供卓越的整體設備效率(OEE)。

一旦我們瞭解這些要求的挑戰和複雜性,我們將開始意識到記憶體和儲存裝置對於啟用數位分身的重要性。

擷取正確的資料是首個挑戰

設計數位分身不只是對物理特性的獨立感測。這也是根據外部和內部子系統之間的互動建立模型的能力。例如,感測發電機震動的諧波剖面,應該亦可得出有關該影像如何與馬達、軸承、皮帶的物理特性相關,以及該影像對該互動的影響的見解。若有人真的想為機器打造「數位分身」,僅需在其周圍安裝感測器,沒有對值相互依賴的任何感測,就無法提供準確的「分身」。

棕地應用亦讓該操作更加複雜,因為將新的感測器加裝到已經運作的機器上並非易事。事實上,對概念驗證的第一次嘗試是加裝具有最小介面的 DIY 或嵌入式主機板,以支援感測器到雲端的資料轉換。新增連接件是一回事,但進行實際建模時又完全是另一回事,您需要能夠儲存動態資料,並將其與經過訓練的模型進行比較。此外,考慮到您想要建模的幾十或數百種類型的系統,此方法當然不是最具可擴展性的解決方案。

運算將持續演進

裝入 CNN(卷積神經網絡)加速器的新處理器架構是實現加速推論運算的良好開端。配備這些裝置不僅是為了攝取模擬訊號,亦是為了處理、接入及過濾掉資料信噪,並為與模型相關的值留出富餘量。這些裝置乃為平行作業速度介於 GFLOPS(每秒十億次浮點運算)至大約低於 20 TOPS (每秒萬億次運算)的智慧型端點量身訂做。

低成本、低功耗的 GPU 亦很重要,因為它們提供本質上會更靈活的硬體式 ML 運算引擎,並提供可實現更高 OPS(每秒運算次數)的運算能力。業界見證了速度低於 100 TOPS 的邊緣用 GPU 或速度超過 200 TOPS 的更多基礎架構級 GPU 的實施。

低功耗 DRAM 記憶體是 AI 加速解決方案的理想選擇

如您所能想象的,視乎架構,搭載加速器的多核心通用 CPU 可能需要 x16、x32 位元的記憶體寬度,而高階 GPU 可能需要高達 x256 位元寬度的 IO。

直接的問題是,若您要將上千兆位元的資料移入或移出外部記憶體進行運算,您將需要記憶體具備更高的匯流排寬度效能。下表基於 INT 8 TOPS 要求顯示對記憶體介面的效能要求。

透過隨新標準不斷演進,記憶體跟上了 AI 加速解決方案的腳步。例如,LPDDR4/x(低功耗 DDR4 DRAM)和 LPDDR5/x(低功耗 DDR5 DRAM)解決方案對先前技術有顯著的效能改善。

 

顯示資料速率圖和降低功耗圖的 AI 加速解決方案資訊圖表

LPDDR4 的速度可高達 4.2 Gbps 並支援高達 x64 匯流排寬度。相較於 LPDDR4,LPDDR5x 的效能提升了 50%,效能翻倍,達到 8.5Gbps。此外,LPDDR5 的功耗效率比 LPDDR4X 高 20%。這些是將提升整體效能並將滿足最新處理器技術需要的重要發展。

嵌入式儲存裝置隨機器學習的複雜性演進

認為運算資源受限於處理器的原始 TOP 或記憶體架構的頻寬是不夠的。隨著機器學習模型越來越複雜,模型的參數數量也呈指數級增長2

機器學習模型和資料集擴展,以獲得更好的模型效率,因此也需要效能更高的嵌入式儲存裝置。速度達到 3.2Gb/s 的 eMMC 5.1 等典型的管理型 NAND 解決方案是代碼啟動和遠端資料儲存的理想選擇。UFS 介面等較新的技術速度可達 7 倍,達到 23.2 Gb/s,可供用於更複雜的模型。

這些嵌入式儲存技術亦是機器學習資源鏈的一部分。

以正確的記憶體啟用數位分身

業界知道邊緣端點和裝置將瞬時生成數十億位元組的資料,這不僅因為其精確性,還因為對攝取資料的需要將有助於改善數位模型,而這正是數位分身所需要的。

此外,代碼將需要擴展,不僅為了管理資料流,亦是為了管理邊緣運算平台的基礎架構,以及新增 XaaS(X 即服務)業務模式。

數位分身技術具有巨大潛力。但若您做的「分身」類似於僅給臉部的「鼻子」或一隻「眼睛」建模,那麼若沒有全臉圖像,將很難確定這是否是您的分身。因此,下次您想討論數位分身時,請知悉有許多因素需要考慮,包括要監控的事物,以及需要多少運算記憶體和資料儲存裝置。美光作為工業級記憶體解決方案的領導者,提供廣泛的內嵌式記憶體,包括我們用於快速 AI 運算的基於 1-alpha 技術的 LPDDR4/x 和 LPDDR5/x 解決方案,以及內嵌入我們支援 eMMC 和 UFS 的儲存解決方案的 176 層 NAND 技術。這些記憶體和儲存技術將是為您提供您所需的運算需求的關鍵。

1.  IDC FutureScape,2021 年

2. 「Parameter Counts in Machine Learning(參數在機器學習中十分重要)」(Toward Data Science),2021 年

市場區隔資深經理

Wil Florentino

Wil Florentino 是美光科技(Micron Technology)工業業務部門的市場區隔資深經理。他的職責包括提供 IIoT 和工業邊緣運算等工業市場區隔的市場情報和主題專業知識,以支援新產品藍圖記憶體解決方案。Florentino 先生在嵌入式半導體技術領域擁有 20 多年的經驗,包括 SoC、FPGA、微控制器和記憶體,其工作主要側重於工業應用。