各種各樣的資料看起來什麼樣? 當美光業務拓展經理 Eric Caward 拍攝一系列資料時,他設想一座山,每塊泥土和岩石都代表著一條資訊。乍看之下,這座山就像一大堆大數據,對某些人而言可能無異於一堆塵土。但精明的採礦者知道有些山中含藏著黃金碎片。
在如山的資料中,這些黃金碎片代表著可用於獲得更深見解的有價值資訊。一系列室內溫度讀數可能不像最有趣的大數據山,但其內部趨勢可能被證明非常有用。如果房屋往往在一天中的某個時間過熱,追蹤該趨勢可以幫助屋主更好地優化其供暖系統,並節省熱費。
透過淘金,即黃金累積在鬆散的礦料中,在需要用水沖刷來提取,採礦者開始淘澄以獲得黃金碎片。雖然淘金是一種簡單的技巧,但並非從大量沉積物中提取黃金的最佳方法(就像從如山的大數據中獲取適當的資訊一樣)。這就是為什麼更有效的採礦者轉用洗礦槽和篩分裝置,以更快地處理大量沉積物,找到寶藏。
電腦如何成為熟練的採礦者,並高效地篩遍這座大山或大數據,以找到和發現那些黃金碎片? 需要快速的資料分析,方可以有效地擷取重要資訊。雲端的溫度讀數列表從表面看來幾乎毫無價值,但如果電腦系統可以加以掃描,識別其中的趨勢,並快速得出解決方案,便是發現了寶藏。我找到寶了!
為最好地處理該快速資料,電腦系統需要高效且延遲最小的記憶體。任由這些趨勢掩藏在泥土中對任何人都沒有任何好處。幸運的是,要說在一個系統中移動資料,沒有比超快的動態隨機存取記憶體(DRAM)速度更快的了。
用大數據為快速資料提供資訊
根據 Entrepreneur 2016 年的一篇文章,資料的收集正以驚人的速度暴增。到 2020 年,每個上網的人每秒會建立 1.7 MB 的新資料,新增至屆時將達到 44 ZB 的資料中。
隨著科技在日常監測人體生命徵象的能力方面的發展,無論是透過偵測心率和睡眠模式等項目的小型穿戴式裝置,抑或監測血糖和血壓的醫學創新,醫療保健組織均可以革命性的方式在預防醫學中提供幫助。隨著 IoT 裝置(無線連網並可傳輸資料的非標準運算裝置)的普及和持續追蹤患者健康的不同要素的工具不斷增加,每分鐘都會建立更多大數據。
在廣告代理商決定將哪些贊助貼文投放到使用者的社交媒體新聞摘要中時,必須篩遍所有可用資料,找到相關內容,以便與該使用者形成有效互動。如果選對了,對廣告商而言,該選擇無異於純金。
當人工智慧(AI)計畫查看一個人的個人檔案時,會看到幾位元的瀏覽資料,也許是 Amazon 瀏覽歷史記錄、YouTube 訂閱方塊和大量 Google 搜尋的組合。快速資料可迅速將這些資訊串連在一起,在線上購物車中定位汽車商品,記錄先前檢視過的「如何更換 2012 Ford Explorer 煞車來令片」YouTube 影片,並註冊一致的 DIY 專案文章。在此情況下,該計畫可以輕鬆地為當地汽車配件商店輸出廣告。隨著 AI 變得更加智慧,資料變得更快,資料會顯示您已購買過煞車來令片,因此廣告可能會轉而側重於完成更換所需的凸耳扳手和千斤頂支架。
Caward 表示:「如果該計畫利用速度非常快的記憶體系統來立即攔截和解讀資料,並可以立即在網站上推送相關廣告,便可能會促致點選連結和銷售。」
為足夠快地攔截那一系列資料,執行這些 AI 和機器學習計畫的裝置需要有足夠大的頻寬,以接納就特定社交媒體個人檔案和瀏覽器歷史記錄儲存在雲端的所有大數據,找出重要的黃金碎片,並在接近處理器的地方加以分析。Caward 表示,「我們通常稱為熱資料」的重要資訊越接近系統處理器,使用者將看到的傳回值就越多。這就是美光花重金投資創造更快、更高效的記憶體解決方案的原因所在。
從硬碟到固態硬碟和提速
不僅僅是加快系統內資料移動速度的可靠 DRAM。系統可以透過從傳統硬碟(HDD)移動至固態硬碟(SSD),獲得寶貴的毫秒級速度。標準硬碟需要更多的技術移動方可取得資訊,然後必須進行實體旋轉,方可讀取資料,耗費寶貴時間。
「當您移動至快閃(SSD)記憶體時,您不用實際移動任何東西,因此可以更快地存取該資料。」 Eric Caward,美光業務拓展經理
據 Caward 稱,當您移動至快閃(SSD)記憶體時,「您不用實際移動任何東西,因此可以更快地存取該資料。」
現今的處理器正在推進速度界限,將標準的 3 或 4 Gb 速度提升至 4.5 或 5 Gb。Caward 稱,如果您在「以奈秒處理資料,而您為得到資料需等待的時間不是以微秒計,而是以毫秒計,那麼在多出的那段時間,您的 CPU 就無事可做。」 為避免在取得結果前浪費數秒的時間,記憶體實際上被放置在越來越靠近處理器的位置,並專為 GDDR5, GDDR5X和 GDDR6 記憶體形式的高效能運算而設計。
為盡快在低延遲和高頻寬下移動這些資料,Caward 解釋說,記憶體「實際上焊接在運算裝置旁邊。」
將快速資料應用於現今的技術
隨著更快的記憶體解決方案問世且每日改善,機器學習和 AI 擁有無數的應用程式,包括 Caward 稱之為這一代的聖杯——自駕車。這些車輛中的感應器會持續監控輸入資料,包括交通訊號、位置感知、與其他事物(特別是車輛和人員)的距離,並分析針對特定情況該採取何種行動。
Caward 表示:「基本上,您只是將大量資訊輸入您車上的超級電腦,並在處理這些資料。您把沒有用的資料剔除,讓資料更易於管理。您會進行一些內部處理。您會透過各種網絡向外與(或許是)雲端連接,處理更多資料,然後做出相應的反應,以便您以安全的方式抵達目的地。」
快速資料在醫生診所亦發揮著神奇的作用。與其將一份 CAT 掃描發送給 3,000 名醫生,請他們各自分析細胞,不若將一份 CAT 掃描提交至透過分析多年的惡性和非惡性細胞學習如何識別惡性細胞的神經網絡。
Caward 表示:「這些偵測率將一路飆升。一旦它被輸入電腦,並且您有快速資料,它就可以在自動駕駛時執行。」
由於美光正在推進可提高資料處理速度的產品,因此有助於擴展這些類型的應用程式。處理器越來越快,並將繼續計算越來越多的資訊。但如果餽送至 26 核處理器的資料僅夠佔用一個核心,其他核心就無事可做。大數據和快速資料頗具價值,但前提是它們須得到充分運用。
Caward 表示:「您得到這塊處理邏輯的矽晶片,它促使資料移動。但它移動的速度迫使您必須盡快向其傳輸資料。否則,您就會浪費其潛力。」
透過使用美光 DRAM 和 SSD 將這些資料快速移動至 CPU,其潛力便不會被浪費。系統可以整理如山的大數據,揭示隱藏其中的黃金資料,為得出新的結論和見解鋪路。