個人化是客戶參與度的「聖杯」。正因如此,《哈佛商業評論》報導稱,個人化的使用者體驗可帶來行銷資金五到八倍的投資回報,並可提高 10% 或甚至更高的銷售量。
雖然個人化內容有助於建立更深層的關係及更好地瞭解使用者,但創建有效推薦所需的大量資料卻令人生畏。運用先進的資料中心基礎結構以及高效能記憶體和儲存解決方案,進入人工智慧 (AI) 引擎領域。
這些推薦引擎現在主導著線上體驗,最顯著的範例就是亞馬遜公司。一項麥肯錫報告顯示,這家零售巨頭 35% 以上的銷售來自推薦。但這些引擎不僅只是對購物產生影響力:串流媒體網站向使用者顯示他們可能感興趣的電影或節目,求職網站向使用者顯示他們符合資格條件的工作機會,而新聞和社群動態消息推送相關內容。
就串流網站而言, 四分之三的 Netflix® 使用者選擇觀看推薦引擎建議的電影,而 80% 的 Netflix 整體串流時間 是在播放這些建議影片。Hulu™等服務增加了「喜歡」和「不喜歡」功能,讓使用者對獲得的推薦節目有更多主控權。
資料中心在後台建立這種高度個人化的網際網絡。精密的演算法,讓推薦已經變成使用者體驗。與許多其他先進技術一樣,如果沒有像美光製造的那些記憶體及儲存解決方案,推薦引擎就不會存在。
推薦引擎是什麼?
簡而言之,推薦引擎是一種根據使用者可能對某項目給予的評分或偏好來建議資訊的系統。
這種引擎的誕生完全是源自需求。我們每天製造 2.5 百京位元組的資料。(百京是一兆的一百萬倍。) 而全球 90% 的資料是在近兩年生成。光是 Facebook® 與 WhatsApp™ 每天就要處理 600 億則訊息,而 Instagram™ 每天上傳的照片超過 9,500 萬張。
有太多資料需要篩檢,不只是因為數量龐大,也跟種類與品質有關。每個人都曾經歷過在電子商務網站瀏覽頁面,卻發現顯示的選項不吸引您或與您無關。
那麼收到糟糕推薦的體驗又是怎麼一回事? 為什麼會發生這種情況呢?
這一切都與資料有關。對推薦引擎來說,資料愈多,它的結果就愈準確。在作出建議時,它就已經透過以下其中一種方式篩選:
- 一般:這是最簡單的篩選方式,提供與使用者搜尋內容相似或最熱門的項目。
- 內容:這種篩選方式會檢閱使用者記錄,找出形容選擇的關鍵字,然後提供相似內容的建議。
- 共同點:系統會依據記錄,將使用者分類到某個群組,並顯示該群組其他成員喜歡的項目。
- 整合:這個方法結合了多種篩選方式。
上述的每個篩選方式都愈來愈複雜。整合方法雖然最準確,但需要最多資料,執行上也最困難。
如串流媒體,為了做出準確推薦,引擎需要電影類型、劇情大綱、演員和導演的資料、使用者的電影觀看記錄,還有與其具有類似觀影習慣的觀眾的觀看記錄。此外,引擎還要參考評論、社交媒體評價,甚至是劇本使用的語言。這些是相當龐大的資料,需要大量的記憶體和儲存空間來處理這些工作負載量。
1. 資料收集
為了提供最佳的推薦,就需要大量的資料。數十億筆來自各式各樣的資料來源,且經過篩選的使用者互動記錄,會被收集在一起。資料收集需要可擴充的儲存容量,像是四層單元(quad-level cell,即 QLC)SSD。擁有 QLC NAND 記憶體的 SSD 在容量、速度和成本間提供平衡,總體擁有成本對雲端供應商具有一定吸引力。
2. 篩選及預處理
機器學習系統擁有數百萬位顧客的記錄與動作,而且系統會不斷更新。這項資料通常是以非結構式形式擷取。在資料可用以前,必須先經過篩選並保留關鍵資訊,再以有效率的方式組織。想想看,在非結構式資料中找到您需要的資料點,就像是要在知名童書《威利在哪裡?》裡尋找威利,只看得到人群在擁擠的環境裡移動。可憐的威利可能永遠不會被發現。現在再想想看,威利周遭所有的人都站得筆直,排列成網格模式。雖然可能變得沒這麼好玩,但會比較容易找到威利。要將移動的混亂人群排成有順序的直線與網格,基本上就是篩選及預處理資料在做的事情。組織資料這個問題,最好由 CPU 處理,而伺服器 DRAM 在一旁支援;像是 DDR5 可暫時保留預先處理的資料,並迅速提供給處理器。資料經過處理且變得有結構以後,快速的 NVMe™ SSD 便能儲存,接著用來進行 AI 訓練。
3. 訓練
在這階段,AI 會教導引擎辨識內容。例如,系統可能需要分析數十億張的影像,才能學會如何辨識一隻狗。這需要將資料片段在訓練系統中傳遞數百或數千次。然後,隨著新的資料進來和使用者互動,您要定期使用更新過的資料庫再次訓練這個模型。這個過程需要極度強大且具彈性的資料中心,來執行演算法的複雜訓練。像是美光超頻寬解決方案系列的高頻寬記憶體,以超高速度反覆提供資料給圖形處理器(graphics processing unit,即 GPU)或 CPU,讓邏輯連接建立 AI 演算法。隨著資料量成長,還有 AI 演算法愈來愈複雜,在訓練過程中對記憶體的需求持續增加。但需要的不只是更多的記憶體,而是能帶來更聰明、更快速 AI 的全新記憶體,像是每條線路要能移動 2 位元的資料,而不是只有 1 位元;或是 3D 堆疊式記憶體,會移至與處理器最相近的位置,並且放在相同晶片封裝。而美光在研發新型記憶體的創新領域,佔據領頭羊的地位。
4. 推薦
接下來是推斷。當向受訓過的系統詢問某部電影裡是否有狗,只要它辨識到狗,便可做出推薦。這項行為可能每分鐘會因不同使用者而進行數百萬次,發生地點可能在資料中心或靠近終端使用者,有時候就在他們的手機或筆記型電腦裡進行。高效能記憶體要確保推薦出現得夠快,才對使用者有意義,也讓供應商能從中獲利。
5. 最佳化
使用者與推薦內容的互動會回傳至資料收集階段,繼續最佳化未來的推薦,讓引擎得以學習,並且變得更準確。
透過縮短擷取與移動資料所需的時間、提供處理器所需的充足資料,以及儲存每天持續增加的海量資料,記憶體與儲存裝置在推薦引擎流程中的每個階段都發揮著作用。一旦少了美光等企業製造的產品,就不可能建立推薦引擎。
推薦引擎的前景如何?
推薦引擎已經改變線上服務的使用者體驗與商業模型。這也難怪網站要尋求新方法,試圖在他們的平台上提供推薦。
例如,亞馬遜公司機器學習科學家 Ben Allison 指出,過去的使用者事件的重要性並不相同。瞭解到顧客行為的異常複雜性,亞馬遜公司現在要求神經網絡區分過去行為的重要性(基於背景及時間),然後給予「關注度評分」。這些關注度評分成為更精密的推薦演算法的關鍵部分。
此外,亞馬遜公司發現「可預測」的預測並非無懈可擊。在加入一些「隨機性」後,他們已能夠複製所有消費者想要的「偶然發現」。因此,今天亞馬遜公司的推薦更多是來自於人工智慧的「決策」,而不僅僅是一般的預測。
某些網站會讓人類編輯即時互動,並搭配推薦引擎來讓演算法更加準確。舉例來說,Hulu 的「內容專家團隊將更緊密合作,為觀眾建立更多策畫過的系列作品。」
此外,Netflix 正在利用推薦演算法,瞭解內容成功擴散的特點,來決定他們電影和電視節目的方向:「在 Netflix 迅速成長的工作室中,我們運用推薦演算法優化原創電影與電視節目的製作。演算法也為我們的廣告支出、頻道組合與廣告創意帶來動力,我們便能找到喜歡 Netflix 的新會員。」
對於目前和未來的推薦功能,資料量上限與最高速度非常重要。資料儲存、AI 訓練與推薦引擎推斷都需要高效能且低功耗的記憶體與儲存裝置。
美光廣泛的解決方案產品組合涵蓋了推薦引擎的需求,囊括密集訓練所需的高頻寬記憶體與加速器、推斷時所需的標準記憶體,以及存放各種資料的高容量儲存裝置。如果購物者收到的聖誕禮物推薦完全符合其心意,或觀眾收到的電視節目推薦是其最愛的類型,那麼美光記憶體和儲存裝置很可能參與了整個推薦過程。
深入瞭解美光產品,得知美光如何將推薦引擎變成可能。
美光是 Micron Technology, Inc. 的註冊商標。此篇文章提及的所有其他商標和註冊商標皆為它們各自擁有者的財產,在此只用來援引例子。包含其他商標、註冊商標與品牌,美光皆無背書或推廣之意,或是指涉雙方存有企業合作關係(即使可能有)。