數據速度

個案研究:Micron 利用數據和人工智慧觀看、聆聽與感受

RATE THIS STORY:
Rating Unavailable Rating Unavailable Rating Unavailable Rating Unavailable Rating Unavailable
VOTES SO FAR

在人工智慧為工業帶來的眾多優勢方面,記憶體晶片製造商Micron Technology總是多做少說。Micron將數據與AI運用在製造過程中,真正實際投入資金,利用新一代的記憶體儲存和處理解決方案,展現其擁有的技術商業價值。人工智慧擁有許多優勢,包括更高的產量、更安全的工作環境以及提升效率。

企業之工廠透過高度複雜與精確的過程,將記憶體技術運用於矽晶圓上,在製造過程中,有極高的可能性會產生失誤與損耗,但是數據和人工智慧有助於降低此可能性。當依靠人類的警覺性,發現與追蹤瑕疵、機械問題以及其他潛在問題區域時,通常會導致公司虧損金錢-使用今日的尖端技術則可避免此類損失。

製造過程

矽晶圓,製造電腦晶片的基礎,是以二氧化矽(一種沙的類型)製成,必須進行過濾才能提煉至99.999%的純度,此電子級矽是經過溶解後壓縮為矽錠,再切成厚度極薄的0.67mm晶圓。

晶圓需要拋光以去除切割產生的任何痕跡,接著在表面覆蓋一層薄薄的光阻材料,並利用與攝影成像過程類似的電路圖設計進行蝕刻。越複雜的電路圖,壓印在晶圓上的圖案越多,並層層相疊,且每一層都分別採離子化電漿噴灑處理,例如:稱為「摻雜」的過程或浸泡於金屬溶液中。

在測試(針測)之前,晶圓成品必須覆蓋一層薄薄的保護膜,確保其能如期發揮作用。

整個製造過程包含大約 1,500 個步驟,且必須在無菌的潔淨晶片加工室中進行,此設計是為了預防最小的灰塵微粒落在未受汙染的晶圓上,但是確實會發生毀損,脆弱的晶圓可能會刮傷、出現缺口、刺穿或在保護膜下形成氣泡。

Micron科技總監Tim Long表示,此結果證明AI系統比工程師的評估更準確。

這些瑕疵通常非常細微且肉眼難以辨識,即使可以辨識,也可能會因為每一個晶圓在攝影成像過程中會拍攝30 到40張照片,導致人們在檢視時因為眼睛疲勞或短暫的分心而忽略瑕疵,一眨眼,就錯過了。

若直到「針測」階段才發現問題,則已浪費了大量的時間與金錢,有時候,造成瑕疵的問題會影響多個晶圓,甚至可能是上千個晶圓。

生產製程中的其他步驟也可能會發生錯誤,零件磨損、管線洩漏,或危險化學製品滴落在產品或人員身上。最重要的是儘早發現與改正問題:根據Micron專家的經驗及半導體製造的複雜性,停工付出的代價極高,平均每小時耗費25萬美元,投入復原過程數個小時,付出的實際成本即達數百萬美元,更重要的是,與作業人員受傷有關的風險有很多種。

偵測產品和機器中的問題,對於製造效率、有效性及安全性而言至關重要,遺憾的是,人會造成錯誤,即使是訓練有素的人員也無法絲毫不漏地看到、聽到或感受到某些錯誤的細微信號。

但是,人工智慧技術卻可在短時間內,以如同雷射般的敏銳精準度執行這些任務。Micron從全球超過8,000份原始資料和500台以上之伺服器中蒐集了上千兆位元組的內部製造數據,並將資訊新增至Apache Hadoop中兩種不同的環境地圖,以實現資料探勘之目的。組織中的數據科學家則透過這些製造網絡搜索該數據,獲得發展AI和機器學習模型的見解,進而改善與提高工廠的製程效率。

模仿人類視覺、聽覺和觸覺的成果不僅令人印象深刻,更使他們在2018年為Micron贏得專為科技領導力而設,令人稱羨的百大資訊長獎(CIO 100 award)

視覺:晶圓成像技術

晶圓有很多種形式的瑕疵,但是,在大多數情況下,瑕疵可分為數種常見的類別:晶圓邊緣附近有微孔、刮痕,以及外側薄膜有氣泡。在電路圖蝕刻至晶圓上的製造過程中,Micron的AI系統會使用「電腦視覺」技術,在微影成像相機拍攝的照片中尋找此類瑕疵。

舉例而言,工程師可以操控此系統掃描晶圓邊緣的微點(孔)、連續或輕微的折線(刮痕),或找出導致深色或淺色斑點、圖案的色花現象。在拍攝照片後10秒內,可透過系統警報即時找出部分瑕疵, 以及在照片儲存後15分鐘,進行第二次掃描找出其他瑕疵,而所有過程都需要依靠AI系統使用儲存在Hadoop環境中的兩百萬張照片,進行比較與對照。

Micron科技總監Tim Long表示,此結果證明AI系統比工程師的評估更準確。

「電腦視覺具備高準確度和高效率。」他說:「且能擴展工程師的能力, 讓工程師可以著重於問題和資料蒐集。」

擁有Micron AI自動偵錯分類(ADC) 系統後,技術人員和工程師不再需要在Hadoop中手動進行晶圓瑕疵分類,取而代之的是由AI-ADC利用深度學習,每年針對數百萬種瑕疵進行分類整理。Micron是使用今日可行的最新成像技術創造此系統,包括描述為生物啟發程式設計方法的神經網絡,使電腦能從觀測數據中學習。

Case Study Infographic

此機器之學習形式係根據瑕疵為照片分類,並置於離散的Hadoop「叢集」中,此程序不僅能協助工程師發現製程中的問題,並能及早修復以避免出現更多瑕疵,同時可以讓AI系統自行發現瑕疵,以及在每一次反覆運算中優化結果。

「您無須將尋找的位置與目標告訴系統。」Micron晶片加工數據科學經理Ted Doros表示:「僅需要提供一些範例及告知神經網絡『這是需要找尋的目標』,

此程序就會將我們的方法微調以提升產量,而微調越多,我們的問題就越少。」

聽覺:聲學聽力技術

您的車子出現機械故障的第一個徵兆為何?通常是從車蓋下傳出不尋常的噪音,同樣的狀況也會發生在工廠中,被視為異常的聲音可能代表零件已磨損或即將發生損壞。

製造工廠可能會產生非常大的噪音,且故障的聲音很容易遭到掩沒,或作業人員可能無法在同一地點停留太久,而無法分辨出「正常」和異常的聲音。

Micron的AI系統可透過安裝在機器人傳動器上或泵附近的聲音感應器,聽出工廠機器中的異常聲音。這些麥克風會記錄數週的正常活動聲音,然後利用軟體將偵測到的頻率轉換為圖形或圖表,亦即將聲音描繪為視覺數據,當出現新的音高或頻率時,系統就會發出警報,且通常甚至可分辨出異常的原因。

Doros將工廠中的各類聲音比喻成一個交響樂團,並將聲學聽力啟動器 比喻成指揮。

「你能在所有樂器一起彈奏時,即使是既有秩序出現了非常細微的變化,如同,如果你有一把法國號,而樂師將活塞稍微打開一點,就會改變音高和整個聲音。」觀眾可能聽不出變化,但是指揮不會聽不出。

「電腦視覺具備高準確度和高效率。」他說:「且能擴展工程師的能力, 讓工程師可以著重於問題和資料蒐集。」

Micron工程師為了建立此「聲學聽力」AI系統,使用初始監測階段中蒐集的數據,在Hadoop中設立基準線。接著,掃描異常聲音檔,根據形成的原因進行分類,並置於離散的群組或「叢集」中,且蒐集、檢測與分類的檔案越多,聲音辨識結果越準確,系統具有之偵測和診斷異常聲音及其原因的能力越佳。

搜尋此類大量資料庫非常耗時,但是,工廠經理必須在機器出現故障危險時,立即辨識出原因。

將數據發送至搭載Micron 記憶體和儲存技術的GPU系統,該系統配備48,000顆處理器和上兆位元組的記憶體,可提供比CPU系統更快速的智慧運算結果。所有的GPU處理器和記憶體皆會同時與同步運作,可在少數或甚至無人為干預下,瞬間優化其結果,並在反覆運算中提升診斷結論,此過程與人類的大腦運作方式類似。

Micron高級研究員Mark Helm表示:「GPU的主要優勢之一,為CPU在單晶片上可能有二或四顆處理器,每一顆處理器可一次完成一件事,而GPU擁有上千顆處理器,可平行處理數以千計的事。AI工作負載能確實符合您的需求。」

「您不會想要讓CPU進行非常複雜的機器學習演算法,而GPU可利用成千上萬個同時運作的處理器,將演算法分成許多微小片段進行平行處理,GPU處理器可在執行決策時提供驚人的優勢。」

熱成像技術:感受熱度變化

不是每一次發生故障都會產生噪音,在製造環境中,無聲也可能會造成致命的結果,在許多情況下,反而會出現溫度變化,機器可能升溫,或泵或管線可能會降溫,因為洩漏處失去熱度而導致蒸發冷卻。

直到近期,發現溫度遽變的唯一方法,仍是依靠是否看見紅光、火花或煙霧進行分辨,當出現這些現象時,問題已進入危險範圍,工廠必須開始撤離作業人員。如上所述,停工需要付出極大的代價,但是不停工則可能會危及人員的安全。

涼爽部位也可能會出現問題,但是不會出現明顯的跡象,而利用手感受熱量波動,既危險且不實際。

但是,現在有越來越多的人工智慧可以透過分析紅外線攝影產生的工廠環境「熱點圖」,發現溫度異常現象,Micron已在正常工作條件下建立重疊影像,並將其置於晶片加工的雙生數位化上,亦即一座虛擬的複製工廠。這些圖像可為AI系統提供一個與紅外線圖比較的基準線,當系統偵測到誤差時,便會發出警報。

「這是一場企業轉型,而非僅針對工作場所。」Doros表示:「我們可以將這些技術和方法擴展至公司內的所有企業流程中。」

Micron的熱成像仍在發展初期,其因為具備能在機器故障或嚴重損壞前,及早發現即將產生問題的能力,而被視為擁有節省成本的巨大潛力。早期偵測出問題,可產生簡單維修和更換整個昂貴設備零件兩種截然不同的結果。

在保護作業人員方面扮演重要的角色,更成為Micron優先考量的重點。公司重視團隊成員的安全更勝於利益,這也是公司持續大力投資技術的主要原因,目標是在問題變成危害之前,提升偵測問題的技術。

Doros說道:「如果系統偵測及指出『這裡的泵具有高風險』,或出現熱失控或火花之情況時,我想要立即知道及通知該區域的人員撤離。」

熱成像技術的首要目標是早期偵測出機器問題,但是,公司亦會將此技術應用於製造系統和最佳化製程。Doros表示,系統可用性是Micron在生產晶圓時最高的成本之一,系統停機,將會減少用於製造晶圓的工<具,當晶圓生產量下降,就會提高晶圓加工的運作成本,而未偵測出工具故障則會導致晶圓損壞,同時會增加成本。

Doros表示,理想的情況是Micron在每一座晶圓加工廠中,為每一項工具建立熱成像感應器,並及時找出所有溫度過高或過低的部位,然後進行微調,將可能會提高產量,進而降低每一片晶圓的生產成本。

好處多多

對Micron而言,目前為止,在工廠中使用AI觀看、聆聽及感受,產生的結果令人印象深刻:

  • 到期收益時間縮短25%,
  • 製造產量增加10%,且
  • 品質事件降低35%。

數據分析和AI 的優勢已超越晶圓廠,擴大至Micron營運的各個層面中:業務與行銷、人力資源、企業經營、研究與發展等。

「這是一場企業轉型,而非僅針對工作場所。」Doros表示:「我們可以將這些技術和方法擴展至公司內的所有企業流程中。」

Doros舉例說明,深度學習能明顯提升產品需求的相關預測,同時能將準確度提高10%到20%之間。

公司著重於人工智慧和數據分析的主要重點,為工業程序以及以真正的「智慧」虛實整合系統運作晶圓廠,並減少人為干預之承諾。

隨著5G蜂巢式網絡(行動網路)、虛擬與擴增實境、IOT,以及AI和數據分析等技術進展地越來越快,使實現依賴Micron自有之記憶體和儲存解決方案協助進行發展的承諾也越來越近了。

「AI涵蓋很多東西。」Long指出:「AI能真正描述診斷功能,以及我們如何使用機器學習演算法創造人工智慧。我們是透過提供演算法數據及使用紀錄,做為承上啟下的脈絡訓練系統,進而仿製聽覺、觸覺、視覺等人類的感官,之後,機器會觀察和學習各類模式,進而能自行做出結論。」

+