設計工具
應用

DNA 具有儲存全世界資料的絕佳潛能

Micron Technology | 2020 年 3 月

人類正處於一種前所未見的資訊爆發邊緣。我們會怎麼處理產生的所有資料?

這個問題並非無關緊要。我們的電腦、智慧型裝置、電視、溫度調節裝置、家用保全系統、數位個人助理、穿戴式裝置、汽車、機器人和其他裝置產生和使用的資料量,都是以指數型方式遞增中。

五年前,我們因數位技術所產生的總資料量為 4.4 ZB。這數字是 4.4 個千的七乘方位元組,也意味著資訊的快速成長。但那個數字在今天已經黯然失色:如今我們每年產生大約 16ZB 的資料,到了 2025 年時,預期資料量將會是這個數字的 10 倍。

我們使用在沙中發現的矽所做成的晶片,來收集、處理並儲存資料。儘管它是地殼中第二豐富的元素,純矽(製作許多種電腦晶片所需的一種)卻很稀少,低於總矽供應量的 10%。

矽的使用正在快速耗盡中。根據一項研究指出,到了 2040 年,資料氾濫可能會影響電腦級矽元素的全球供應量,並對新技術和數位科技的進展造成重大衝擊。

防止此一災難的一個方式就是改善矽提煉的程序。此外,研究人員正在尋找資料處理和儲存的替代材料,如三氧化二鎵、鉿聯硒化物和鋯聯硒化物及石墨烯。

但還有一項替代可能就是 去氧核糖核酸,或稱 DNA

大自然的資料處理器

每種生物來到世上都伴隨著某些訊息的傳達。我們的頭髮和眼珠顏色、我們慣用左手還是右手、我們容易罹患的疾病,或甚至是我們的氣質,都是由我們的遺傳基因所決定。基因是由 DNA 組成,其攜帶的資訊決定了我們成為什麼樣的人。

DNA 的分子形式是由一個雙螺旋或一對分子鏈(一個是糖,一個是磷酸)彼此交纏而構成的。兩條鏈之間是鹼基,形狀像水平桿,每一根由不同的化學物質組成。鹼基有四種:

  • 腺嘌呤(A)
  • 胸腺嘧啶(T)
  • 鳥嘌呤(G)
  • 胞嘧啶(C)

Micron Technology 的資深研究員暨副總裁 Gurtej Sandhu 表示:「人類身體是最複雜的資訊儲藏庫。」Sandhu 在多個技術領域擁有超過 1,300 項專利。他的個人興趣和研究領域之一是利用 DNA 儲存資料。 

他說,他的靈感來自於領悟到我們身體所含的「無限量」資訊是存在於單個 DNA 細胞中。

「大自然對資料壓縮的程度相當令人驚奇,而且所用的方式仍是人類未知的謎題」,Sandhu 說道。「因此我就想:『我們為什麼不能使用 DNA 作為媒介來儲存資訊呢?』」

Gurtej Sandhu

「人類身體是最複雜的資訊儲藏庫。」

Micron Technology 資深研究員暨副總裁

如何將資料儲存在 DNA 上

DNA 儲存的優勢

隨著科學家越來越瞭解 DNA ,並尋找可以合成 DNA 的方法,他們看見了諸多可能性。一種稱為核酸儲存(Nucleic Acid Memory,NAM)的未來記憶體將可能提供更多的優勢。

容量:一個人的 DNA 中儲存的資訊量很龐大,Sandhu 說。我們的身體含有 5TB(或五兆位元組)資訊。Sandhu 認為,DNA 資料儲存容量比今天所知的任何一種儲存技術都高出許多。

一個系統下,一克 DNA 可儲存 2.15 億 GB 資料,而比一塊方糖還小的DNA,可容納 所有拍過的電影集。一個大約兩輛廂型車大小的 DNA 容量,就可能儲存全世界所有的資料量。

Sandhu 說,會具有此種密度的唯一原因就是 DNA 的四部分鹼基(A、 T、G 和 C),不同於現在計算上所使用的二進位 0 和 1 的系統。這種加倍密度的儲存方式允許儲存的資訊量呈「指數型成長」。NAM 記憶體以分子形式編碼資訊,將資訊整壓成非常微小的包裹。

耐用度: DNA 的存活期很長 ,它在永久凍結帶中冰存長達 150 萬年左右。作為資料儲存媒介的 DNA 可以存活數千年甚至數百萬年。相較之下,最常用於長期儲存的媒介-磁帶,在 10 年後就必須進行更換。

永續性:即使是用於 NAM 的合成 DNA,只需少量的能源就可儲存、處理和讀取。因為它能自行再生,也能重複利用。它還可以很容易地自我複製。

「NAM 可以用更少的空間和能源為後代儲存世界資訊」,Sandhu 和同僚研究人員包括 George M. Church、Victor Zhirnov 等人在 2016 年一篇說明其研究結果的Nature Materials 文章中寫道。

對技術的挑戰

研究人員正在探索 DNA 的用途,首先是作為長期儲存技術,用來儲存醫療記錄、監視影帶、歷史文獻和其他檔案保存資料。以相對少量、儲存時間更長的 NAM 來取代傳統磁帶儲存大量資料的方式。最終,他們希望開發出 NAM 技術來完全取代矽在電腦中的應用。

Gurtej Sandhu

「因此我就想:『我們為什麼不能使用 DNA 作為媒介來儲存資訊呢?』」

成本將是阻礙此目標實現的主要障礙。

Sandhu 表示:「為了讓我們的應用程式能使用 DNA 讀取、寫入、封裝和儲存資料,成本需要大幅降低才行。」 在一項專案中,合成 2MB 的資料成本是 7,000 美元;讀取的成本是 2,000 美元。而讀寫 DNA 的速度比其他類型記憶體的讀寫還要慢。

Sandhu 樂觀其成,認為這些挑戰將會及時得到解決。他指出,DNA 定序的價格已大幅下降,2002 年時,每 megabase 需 31,250 美元(或 100 萬鹼基對 DNA )的情況,在 2016 年已降為每 megabase為 63 美分。對 NAM 的研究也在加速進行。在美光的資助下,研究團隊如哈佛大學、歐洲分子生物實驗室(European Molecular Biology Laboratory)和半導體研究聯盟(Semiconductor Research Consortium;或稱 Symbio)都在開發以 DNA 為基礎的資料儲存技術。博伊西州立大學和 Microsoft 也投入 NAM 的研究。 

光明的前途

電腦級矽原料若在今日消耗殆盡,可能會讓全世界陷入停頓。以我們目前生產資料的速度來看,耗盡全世界矽的供應量是一個令人擔憂的問題,但美光正加速解決這項挑戰。身為電腦記憶體技術的主要製造商,我們處於一個絕佳的位置,率先朝向更好、更快、更永續發展的數位記憶體解決方案邁進。

Sandhu 認為,以 DNA 為基礎的 NAM 很快就能就緒,增強美光 DRAM、NAND 和其他以矽為基礎的記憶體技術。有一天,此種記憶體儲存可能成為常態,完全取代矽。

Gurtej Sandhu

「為了讓我們的應用程式能使用 DNA 讀取、寫入、封裝和儲存資料,成本需要大幅降低才行。」

同時,在開發 NAM 的過程中將可能產出同等重要的結果;Sandhu 表示:

「想像一下記憶體領域的發展過程,100 年前時使用的是磁芯,然後是電子記憶體、光碟機、小型磁記憶體等等。對於這些,我們需要力學領域的知識。

DNA 的複雜程度超過 10 倍以上。我們需要廣納各方領域。因此我們需要記憶體、微流體、化學,分子生物學。為了讓此種技術得以運作,需要不同專家間的緊密合作和技術與科學的廣泛應用。我們需要全方位的技能才能實現這個目標。」

美光是記憶體製造商,這就是為什麼我們在想像和創造新記憶體技術方面為業界龍頭的主因。但是需要各領域專家的合作才能將這些技術帶給世界。

Sandhu 表示:「在我們的產業或其他相關產業中,都不曾出現這樣的前例。這將會是一個令人驚豔的合作機會。而我們僅在初步探索階段。」