記憶體晶片製造商美光科技所做的不僅僅是談論人工智慧為產業帶來的許多優勢。該公司在自己的製造流程中使用資料分析和 AI,真正做到了言出必行,展示了美光利用次世代記憶體儲存和處理解決方案實現的技術為企業帶來的價值。這樣做的好處很多,包括更高的良率、更安全的工作環境和更高的效率。
該企業的工廠透過高度複雜和精確的製程在矽晶圓上生產儲存技術。錯誤和浪費的潛在可能性很高,但資料和 AI 正在幫助減少這種可能性。如果依靠人為警覺來發現和追蹤缺陷、機械問題及其他潛在故障,企業會損失金錢,而透過使用當今的先進技術本可以避免這些損失。
製造程序
矽晶圓是電腦晶片的基礎,由二氧化矽(一種沙子)製成,須經過過濾和精煉,純度達到 99.999%。這種電子級矽被熔化並壓縮成錠,然後切成極薄(0.67 毫米厚)的晶圓。
晶圓經過拋光以去除切割時留下的痕跡,塗上一層薄薄的光阻材料,並使用類似於攝影的工藝蝕刻出所要支援的電路設計。電路越複雜,晶圓上印製的圖像就越多,一層一層地堆疊,每一層都單獨處理,例如,用電離等離子體進行噴砂處理(該過程稱為「摻雜」),或用金屬浸泡。
成品晶圓在測試之前會塗上一層薄保護膜,以確保其能如預期運作。
整個製造流程可能涉及約 1,500 道工序,並在無菌無塵製造室中進行,旨在防止最微小的灰塵落在原始晶圓上。但損壞還是會發生。易碎的晶圓可能被刮傷、劃傷或刺破,或在保護膜下形成氣泡。
這些缺陷通常很微小,肉眼完全不可見。即使缺陷肉眼可見,人在掃描攝影成像過程中對每個晶圓拍攝的 30 到 40 張照片時,也可能因眼睛疲勞或一時疏忽而忽略缺陷。眨眼間,他們就錯過了。
如果直到「探查」階段才發現問題,就已經浪費了大量時間和金錢。造成該缺陷的問題可能不止影響一個晶圓,甚至可能影響數千個晶圓。
生產中也可能出現其他問題。零件磨損;管道將危險化學物質洩漏或滴到產品或人身上。及早發現和修正這些問題至關重要:根據美光專家的說法,停機的成本非常高,平均每小時約為 250,000 美元。考慮到半導體製造的複雜性,恢復所花費的大量時間可能使實際成本達到數百萬美元。更重要的是,與工人受傷相關的風險是多方面的。
檢測產品和機器中的問題對於製造效率、有效性和安全性至關重要。遺憾的是,人難免犯錯,即使是最訓練有素的人也未必絕對正確地看到、聽到或感覺到出問題的微妙跡象。
然而,人工智慧技術可以在極短時間內以極高精確完成這些任務。美光從全球超過 8,000 個來源和超過 500 台伺服器收集數 PB 的內部製造資料,並將資訊添加到 Apache Hadoop 中的兩個不同環境圖中進行資料挖礦。該組織遍佈這些製造網絡的資料科學家們深入分析這些資料,尋找見解,開發 AI 和機器學習模型,以改進和增強工廠流程。
結果仿效我們的視覺、聲音和觸覺,令人印象深刻,因此在 2018 年,他們贏得了美光令人夢寐以求的 IT 領導 CIO 100 獎。
視覺:晶圓圖片
晶圓缺陷有許多形式。然而,大多數情況下,它們屬於幾個常見類別之一:晶圓邊緣附近的小孔或外膜中的刮痕和氣泡。美光的 AI 系統使用「電腦視覺」技術,在製造過程中將電路蝕刻到晶圓上時,從光刻攝像機擷取的影像上發現這些缺陷。
例如,工程師可能指示系統掃描晶圓邊緣的小點(孔),或掃描連續或輕微斷裂的線條(刮痕),或尋找顏色變化導致的深色或淺色斑點或圖案。其中一些缺陷可以近乎即時地被發現,系統會在拍攝影像後十秒鐘內發出警報。其他缺陷可能會在照片儲存十五分鐘後的二次掃描中被發現。所有這些過程都依賴 AI 系統使用 Hadoop 環境中儲存的 200 萬張影像進行比較和對比。
美光 IT 總監 Tim Long 說,結果證明遠比工程師的評估更為準確。
「電腦視覺具有高準確性和高效率」,他說:「並且它已經提升了我們工程師的能力。我們的工程師可以專注於問題和資料收集。」
借助美光的 AI 自動缺陷分類(ADC)系統,技術人員和工程師不再需要在 Hadoop 中手動對晶圓缺陷進行分類。相反,AI-ADC 利用深度學習每年對數百萬個缺陷進行排序和分類。美光運用當今最新的成像技術(包括神經網絡)建立該系統,該系統被描述為一種受生物學啟發的程式設計範式,使電腦能夠從觀測資料中學習。
這種形式的機器學習根據缺陷對影像進行分類,將其置於離散的 Hadoop「叢集」中。該過程不僅能幫助工程師發現製造過程中出現的問題,及早修復,避免更多缺陷,還能讓 AI 系統自行發現缺陷並在每次迭代中完善結果。
「你不需要告訴系統在哪裡查找或查找什麼」,美光晶圓廠資料科學經理 Ted Doros 說:「你給它一些範例,告訴神經網,『這是你需要找的東西。』」
「這個過程透過微調我們的方法提高良率。我們調整得越精細,問題就越少。」
聲覺:聲學監聽
您的汽車發生機械故障的第一個跡象是什麼? 車篷下方通常會發出不尋常的噪音。在工廠中也是如此,異常的聲音可能意味著某個部件的磨損或即將發生故障。
然而,製造工廠可能非常嘈雜,問題聲音容易在噪音中被淹沒。或者工人可能在一個位置上待的時間不夠長,無法辨別什麼是「正常」的聲音,什麼是不正常的。
美光的 AI 系統透過安裝在機器人執行器或泵浦附近的音訊感測器來監聽其工廠機器中的異常情況。這些麥克風會記錄數週的正常活動,軟體將偵測到的頻率轉換成圖形或圖表,以視覺資料形式描述聲音。當出現新的音調或頻率時,系統會發出警報。通常情況下,它甚至能找出異常的原因。
Doros 把工廠的各種聲音比作一個管弦樂團,把具有聲音聽覺功能的機器比作指揮。
「你有所有這些樂器在演奏,當化學品在生產線上出現細微變化時,就像是法國號的音樂家稍微打開一個閥門,音高和整體聲音會發生改變一樣。」 觀眾可能會錯過這個變化,但指揮不會。
為了設定這個「聲學監聽」AI 系統,美光工程師使用在初始監控階段收集的資料,在 Hadoop 中建立了一個基準。接下來,他們掃描檔案尋找異常聲音,並根據原因將其分類,放在離散的群組(或「叢集」)中。收集、檢查和排序的檔案越多,結果就越準確,系統檢測和診斷異常聲音及其原因的能力也就越強。
搜尋這些龐大的資料庫可能非常耗時。然而,當機器面臨故障危險時,工廠經理需要馬上知道。
將資料傳送到裝有美光記憶體和儲存裝置的 GPU 系統,該系統擁有 48,000 個處理核心和數 TB 的記憶體,可以比以 CPU 為基礎的系統更快提供快速、智慧的結果。所有這些 GPU 核心和記憶體同時協同運作,幾乎不需要人為干預即可在瞬間優化其結果,並在每次迭代中改進其診斷,類似於人腦的工作方式。
「GPU 的主要優點之一是,CPU 的單一晶片上可能有兩個或四個處理器核心,每個核心一次可以做一件事。GPU 將擁有數千個核心。它可以同時做數千件事」,美光的資深同仁 Mark Helm 說:「對於 AI 工作負載來說,這就是您想要的。
您不希望 CPU 執行非常複雜的機器學習演算法。GPU 會將其分解成非常小的片段,並同步完成,而這成千上萬個核心都能同時運作。GPU 處理在執行決策所需的時間上提供了不可思議的優勢。」
熱成像 感受到熱量
並非所有故障都會產生噪音,在製造環境中,安靜可能致命。在許多情況下,則會出現溫度變化。機械可能變熱,或泵或管道可能變冷,在發生洩漏時,會因蒸發冷卻而失去熱量。
直到最近,看到紅光、火花或煙霧是檢測溫度升高的唯一方法。出現這些現象時,問題已進入危險區域,工廠將需要疏散工人。如同我們所知,停機成本極高,但相比起冒著危及人員安全的風險,停機還是更可取的。
冷點也可能表示有問題,但這些問題沒有明顯的跡象。並且用手觸摸感覺溫度波動既不實際又危險。
然而,人工智慧越來越多地透過分析製造工廠環境「熱圖」的紅外照片來發現溫度異常。美光疊加在正常工作條件下建立的影像,並將其放置在工廠的數位孿生上,這是工廠的虛擬複製品。這些熱圖為 AI 系統提供了一個基準,用來與紅外影像進行比較。當系統偵測到偏差時,會發出警報。
熱成像在美光仍處於早期階段,由於其能夠在機器故障或嚴重損壞發生之前及早發現即將發生的故障,因此具有節省成本的巨大潛力。早期偵測可以決定是進行簡單維修還是更換整個昂貴設備。
此外,它還能在保護勞工方面發揮關鍵作用,這是美光的首要任務。公司將團隊成員的安全置於利潤之上——這也是為什麼它持續大量投資於旨在在問題成為危險之前改善問題偵測技術的主要原因之一。
Doros 說:「如果系統檢測到並顯示『這個泵有高風險』,如果發生了熱失控或有火花,我希望立即知道,並通知該區域的人疏散。」 熱成像的主要目標是早期偵測出機械問題,但公司也使用這項技術來最佳化製造系統和流程。Doros 說,系統可用性是美光在晶圓生產中產生的最大成本之一。系統關機會減少晶圓製造可用的工具。當生產的晶圓數量下降時,運營晶圓廠的整體成本會上升。未被偵測到的工具故障也可能對晶圓造成損壞,這同樣會增加成本。
Doros 說,理想情況下,美光會為每個晶圓廠中的每個工具建立熱影像,並即時找出溫度過高或過低的所有地方。後續微調最有可能提高良率,進而降低每個晶圓的生產成本。
眾多好處
目前為止,使用 AI 查看、聆聽和感受其工廠,為美光帶來令人印象深刻的成果:
- 良率成熟時間加快 25%;
- 製造輸出量增加 10%,及
- 品質事件減少 35%。
資料分析和 AI 的好處不只是在晶圓廠,還延伸至美光業務的方方面面:銷售和行銷、人力資源、業務營運、研發等。
「這關係到企業轉型,而不只是車間轉型」,Doros 說:「我們可以將這些技術和方法引入公司內的所有業務流程。」
Doros 說,例如,深度學習已大幅改善了對產品需求的預測,將準確性提升了 10% 到 20% 。
然而,公司的主要焦點在於人工智慧和資料分析在其工業流程中的應用,以及晶圓廠作為真正「智能」的網絡實體系統運行,並且最小化人為干預的前景。
隨著5G行動網絡、虛擬和擴增實境、物聯網以及 AI 和資料分析等技術的迅速進步——這些發展得到了美光自身記憶體和儲存解決方案的支援——實現這一承諾變得越來越近。
「AI 包含許多東西」,Long 說:「實際上,它描述了診斷功能,以及我們如何使用機器學習演算法來建立這些能力。我們透過提供演算法資料,並使用歷史作為背景來教導我們的系統,從而重製人類感官—聽覺、觸覺、視覺。機器接著會觀察並學習這些模式,以便其能夠自行得出結論。」