Micron Technology 不只是在談論人工智慧(AI)。該公司在自己的製造流程中使用資料分析和 AI,真正做到了言出必行,展示了美光利用次世代記憶體和儲存解決方案實現的技術為企業帶來的價值。這樣做的好處很多,包括更高的良率、更安全的工作環境、更高的效率和永續發展的業務。
該企業的工廠透過高度複雜和精確的製程在矽晶圓上生產儲存技術。發生錯誤和浪費的可能性很高。但資料和 AI 正幫助降低這種可能性。如果依靠人為警覺來發現和追蹤缺陷、機械問題及其他故障,企業會損失時間和金錢,而當今的先進技術可以避免這些損失。
Linus Tech Tips 的 Linus Sebastian 參觀了美光研&發晶圓廠,並解釋了半導體製造的一些複雜問題。
複雜的製造流程
矽製造是一個極其複雜的流程,耗時數月,涉及約 1,500 個步驟。美光在整個流程中採用先進 AI 來提高準確性和覆蓋範圍。
美光負責智慧製造和人工智慧的副總裁 Koen de Backer 解釋稱:「我們在這裡建構了完全與眾不同的產品。我們看到了更高的準確性。我們現在可以兩倍速度推出產品,同時將工作效率提高 10%。這確實是變革性的。可以說,這是一款殺手級應用程式。」
晶圓製作
該流程從矽開始。晶圓是電腦晶片的基礎,由二氧化矽(一種沙子)製成,須經過過濾和精煉,純度達到 99.999%。這種電子級矽被熔化並壓縮成錠,然後切成極薄(0.67 毫米厚)的晶圓。
晶圓經過拋光以去除切割時留下的痕跡,塗上一層薄薄的光阻材料,並使用類似於攝影的工藝蝕刻出所要支援的電路設計。電路越複雜,晶圓上印製的圖像就越多。該過程逐層進行,每一層都單獨處理,並用電離等離子體進行噴砂處理(該過程稱為「摻雜」),或用金屬浸泡。成品晶圓在測試之前會塗上一層薄保護膜,以確保其能如預期運作。
製造流程在無菌製造室(稱為無塵室)中進行,旨在防止最微小的灰塵落在原始晶圓上。但損壞還是會發生。易碎的晶圓可能被刮傷、劃傷或刺破,或在保護膜下形成氣泡。
這些缺陷通常很微小,肉眼完全不可見。即使缺陷肉眼可見,人在掃描攝影成像過程中對每個晶圓拍攝的 30 到 40 張照片時,也可能因眼睛疲勞或一時疏忽而忽略缺陷。眨眼間,他們就錯過了這些缺陷。
如果直到測試階段才發現問題,就已經浪費了大量時間和金錢。造成該缺陷的問題可能不止影響一個晶圓,甚至可能影響數千個晶圓。
生產中也可能出現其他問題。零件磨損;管道將危險化學物質洩漏或滴到產品或人身上。必須及早發現並糾正這些問題。停機的成本非常高,會導致收入損失並錯過生產時間。考慮到半導體製造的複雜性,恢復所花費的大量時間可能使實際成本達到數百萬美元。更重要的是,與工人受傷相關的風險也數不勝數。最後,美光對永續發展的承諾要求流程盡可能有效節能。
檢測產品和機器中的問題對於製造效率、有效性和安全性至關重要。遺憾的是,人難免犯錯,即使是最訓練有素的人也未必總能看到、聽到或感覺到出問題的微妙跡象。
然而,人工智慧技術可以在極短時間內以極高精確完成這些任務。美光從超過 570,000 個來源收集 PB 級製造資料,並將其加入美光的雲端資料庫環境中。
影像分析
美光 AI 製造的基礎是影像分析。Koen 解釋說:「在半導體製造過程中,影像的作用非常大,您可以分析該過程每個步驟的詳細圖像。」
他繼續說:「透過分析每個階段,我們可以快速識別發生的任何類型偏差,所有這一切都以完全自動化的方式進行。這種分析涵蓋前端、組裝和測試等所有環節。」
除影像之外,美光還採用視訊分析來消除封裝測試中的品質問題。您可能認為視訊資料量太大而不實用。然而,美光再次利用 AI 來確定需要分析的關鍵位置。AI 開啟和停止視訊串流以僅擷取關鍵過程,進而控制資料大小。
成像和視訊尤其有效,因為晶圓缺陷有多種形式。大多數情況下,它們屬於幾個常見類別之一:晶圓邊緣附近的小孔或外膜中的刮痕和氣泡。美光的 AI 系統使用「電腦視覺」技術,在製造過程中將電路蝕刻到晶圓上時,從光刻攝像機擷取的影像上發現這些缺陷。
例如,工程師可能指示系統掃描晶圓邊緣的小點(孔),或掃描連續或輕微斷裂的線條(刮痕),或者系統可能會尋找顏色變化導致的深色或淺色斑點或圖案。其中一些缺陷可以近乎即時地被發現,系統會在拍攝影像後幾秒鐘內發出警報。其他缺陷可能會在照片儲存幾分鐘後的二次掃描中被發現。所有這些過程都依賴 AI 系統使用資料庫環境中儲存的 200 萬張影像進行比較和對比。
事實證明,AI 電腦視覺具有更高的準確性和效率,其結果遠比工程師的評估準確。最重要的是,工程師現在可以專注於問題和資料收集。
借助美光的 AI 自動缺陷分類(ADC)系統,技術人員和工程師不再需要手動對晶圓缺陷進行分類。相反,AI-ADC 利用深度學習每年對數百萬個缺陷進行排序和分類。美光運用當今最新的成像技術(包括神經網路)建立該系統,該系統被描述為一種受生物學啟發的程式設計範式,使電腦能夠從觀測資料中學習。
這種形式的機器學習根據缺陷對影像進行分類,將其置於離散的叢集中。該過程不僅能幫助工程師發現製造過程中出現的問題,及早修復,避免更多缺陷,還能讓 AI 系統自行發現缺陷並在每次迭代中完善結果。
聲學監聽
雖然 AI 成像是製造過程的核心,但美光還採用聲學監聽來預防問題。「異常」聲音通常意味著零件磨損或即將發生故障。
美光的 AI 系統透過策略性安裝在機器人執行器或泵浦附近的音訊感測器來監聽我們工廠機器中的異常情況。這些麥克風會記錄數週的正常活動,軟體將偵測到的頻率轉換成圖形或圖表,以視覺資料形式描述聲音。當出現新的音調或頻率時,系統會發出警報。通常情況下,它甚至能找出異常的原因。
搜尋這些龐大的資料庫可能非常耗時。然而,當機器面臨故障危險時,工廠經理需要馬上知道。將資料傳送到裝有 GPU、加速器以及重要的美光記憶體和儲存裝置的 AI 系統,可以比以 CPU 為基礎的系統更快提供快速、智慧的結果。所有這些 AI 系統都擁有數十萬個 GPU 核心和記憶體,同時協同工作,眨眼間就能完善結果,幾乎無需人工幹預。此外,AI 系統可在每次迭代中改進診斷,與人腦的工作方式類似。
熱成像
並非所有故障都會產生噪音,在製造環境中,安靜可能致命。在許多情況下,溫度會改變。直到最近,看到紅光、火花或煙霧是檢測溫度升高的唯一方法。出現這些現象時,問題已進入危險區域,工廠需要疏散工人。
因此,除影像分析和聲學監聽外,美光還使用熱成像來測量關鍵元件的溫度。
Koen 解釋說:「變壓器的溫度測量是防止過熱的關鍵,早期檢測可以決定是進行簡單維修還是更換整個昂貴設備。」
最後,這些用於影像、聲音和溫度的 AI 感測器兌現了美光對永續發展的承諾。Koen 補充稱:「這些感測器在提高品質和效率方面表現出色,在永續發展方面也同樣出色。它們提供細緻的能源計量,進而顯著提高使用率並節省能源。」
相關數字
在美光,57 萬個感測器在 2.29 億個控制點產生 230 萬張晶圓影像。所有影像每週都會透過 AI 模型進行處理。此外,還儲存了 34 PB 的資料,每天擷取 30 TB 的新資料。
大規模採用 AI 會分析創新的資料科學應用程式,應用領域包括產量分析、數位分身規劃、IoT 與影像分析、最佳化與進階演算法、程序自動化以及行動應用程式。
結果*不容置疑:
- 製造工具可及性提高 4%
- 勞動生產率提高 18%
- 新產品上市所需的時間縮短 50%
- 產品報廢率降低 22%
- 解決品質問題的速度提高 50%
*數字根據美光 2016 至 2020 年收集的內部資料和分析得出
資料分析和 AI 的好處不只是在晶圓廠,還延伸至美光業務的方方面面:銷售和行銷、人力資源、業務營運、研發等。
Koen 說:「這關係到企業轉型,而不只是車間轉型。我們可以將這些技術和方法引入公司內的所有業務流程。」
生態系統夥伴
除了最佳化內部製造流程外,美光還直接與供應商合作,向他們提供有關其產品的詳細回饋,以確保最佳的能源效率。美光與這些供應商共同協調 DIMS(資料攝取至美光系統中),以便以最高頻率攝取資料。美光工程師即時監控攝取過程。同樣,修正和最佳化也在極其細微的層面上不斷進行。
此外,美光與我們的供應商合作,使用遙測資料來衡量我們的產品在其資料中心的效果。這些資料與內部資料相結合,為即時合作提供支援,以針對特定工作負載改進產品。
我們還密切監控模型效能。使用 AI 處理傳入資料並進行重新培訓,可以讓工程師在更高層面上專注於機器學習流程的自動化。(否則,將永遠沒有足夠的資料科學家跟上腳步,他們只能追蹤已發生的事件。)
內部資料科學學院,以及對內部資料科學家、工程師和解決方案架構師的持續投資為這些計畫提供了支援。這些資源與我們的公民資料科學模型使職能專家能夠利用 AI 驅動的工具和見解。
業界領先地位
如今,美光將豐富的核心工藝知識傳統與無與倫比的 AI 效率相結合。資料專家建立了可供全公司 6,000 名員工使用的大型良率管理平台。同時,專注於日常良率最佳化的專門團隊正在快速整合週期中建立新原型。這些原型經常用於主要平台的最佳化。
此外,結果會說話:美光團隊成員的奉獻精神和 AI 驅動的製造流程使我們的 1α(1-alpha)節點 DRAM 和 176 層 NAND 達到美光歷史上的最高良率。領先業界的 1β(1-beta)DRAM 和 232 層 NAND 實現成熟良率的速度比任何其他美光技術都要快。
美光正在對 AI 轉變製造業的方式進行最佳化。這項新技術非但沒有取代每個人的工作,反而增強了團隊的能力,讓他們不再專注於獲取資料和進行多種基礎分析。現在,他們可以專注於自己擅長的領域——不斷創新,開發領先業界的產品。