Facebook的Jason Taylor說,他想用閃存固態盤來作為歸檔介質,這無疑是一顆重磅炸彈,但他的理由卻是有一定道理的。
Facebook用戶在他們的相冊中保存了大量照片,并且很少訪問這些相冊。但是當他們某天想要查看這些照片的時候,他們希望是快速而直接的,不管這些照片是否已經保存了有五年時間之久。
理論上來說,只有一種閃存存儲融合了Taylor想要的這些屬性:低成本、長期、可靠的存儲和高速訪問。
目前有兩種歸檔介質,磁帶和磁盤,當不訪問的時候將其離線,因此幾乎沒有功耗。一旦歸檔介質被訪問的時候,它就要消耗電能,電費是一項很重要的考量,尤其是當你保存了數PB的數據,在未來幾年內還會突破EB級。
磁帶歸檔是多個驅動器及成百上千個離線磁帶插槽組成的磁帶庫。當需要一份文件的時候,機械臂可以找出磁帶盒的位置,然后將它交給一個加載驅動器,加載到磁帶的適當位置,這樣可以訪問到該文件。
讓數據容量翻番
從本質上說,磁帶式最廉價的歸檔介質。與磁盤驅動器不同的是,磁帶盒沒有昂貴的嵌入式驅動器或者電機。磁帶可以安全地保存數據數年甚至是數十年之久還堅固耐用。磁帶還可以壓縮數據,讓磁帶盒實際存儲數據量翻一番或者翻兩番。
磁帶庫也不錯,它只有幾個耗費電能的驅動器,機械臂也不會消耗多少電能。這意味著磁帶庫只用很少的電力和冷卻就可以與一臺在線磁盤驅動器陣列保存相同量級的數據。
當然,磁帶庫要占用數據中心空間,這需要成本,但與基于磁盤的歸檔相比,磁帶歸檔仍然在總擁有成本上低得多。
因此,一直到最近,使用磁盤來歸檔的想法都被認為是可笑的。然而,有兩項先進技術改變了這個局面:重復數據刪除和閑時磁盤停轉。
重復數據刪除:在刪掉重復數據字節方面,重復數據刪除要比數據壓縮好得多,它可以讓磁盤取代磁帶,用于備份和針對短期保護需求的數據存儲,例如恢復丟失的文件或者更換損壞的數據。
重復數據刪除可以實現對備份數據或者VDI數據高達5:1的數據精簡率(對于圖片和結構化數據來說這個比例要稍低一些)。再加上磁盤高速訪問數據的特點,這足以引發用磁盤批量更換磁帶用于備份用途了。
閑時磁盤停轉:當需要的時候,磁盤開始旋轉并且訪問數據,這個過程要比在磁帶庫中找到一個磁帶快得多,因為你要讓機械臂找到驅動器,加載,然后放到合適的位置。
盡管磁盤容量只達到了8TB,未來可能利用疊瓦磁記錄等技術來實現10TB容量,而且每一次容量的提高都會降低磁盤保存數據的每GB成本,但磁帶提高密度的步伐卻更快,IBM已經展示了容量高達154TB的磁帶盒。
Wikibon顧問宣稱磁帶“面密度的增長速度接近30%,而相比之下磁盤只有9.6%”。
磁盤不旋轉就不會耗能,這意味著重復數據刪除和磁盤停轉的成本將在接近磁帶存儲的成本。雖然磁盤在用于數據歸檔方面仍然不如磁帶具有的成本效益和可靠性,但是很多情況下,歸檔數據訪問速度是一個優先考慮的因素,磁盤開始被越來越多地采用。
不過,用戶可能會喜歡一個低成本歸檔數據而不失磁盤速度優勢的方法。他們會說,磁盤停轉對于數據訪問來說還不夠快,這也許好于磁帶,但這就好比將散步與爬行相比一樣,你真正想要的是一種可以沖刺的存儲介質。
一些歸檔使用實例都選擇了藍光光盤作為歸檔截至,但我們知道,這是少數情況,并非主流歸檔介質,這是Facebook的例子。
閃存的閃光點
對于歸檔技術人員來說,閃存吸引人的地方在于,將字位添加到一個閃存單元中會降低成本并提高容量。一個閃存晶圓有固定的表面積,通常來說一個閃存單元的大小是差不多的,不管是保存1字位(SLC)、2字位(MLC)或者3字位(TLC)。
這聽起來不錯,但是每一次你向閃存單元中添加一個字位,你都會降低訪問速度,并且縮短它的生命周期——也就是在再也無法使用前可以寫入的次數。
持續開發更小的閃存單元,以提高提在一個物理區域(在閃存芯片和相應的閃存晶圓上)內可保存數據量,會使得這個問題變得更加嚴重。
下面這張圖顯示了大小不同的MLC和TLC閃存的耐用性差異:

圖 1 閃存耐用性排名
這張圖還顯示了MLC和TLC閃存的耐用性差異,TLC閃存耐用性是以數百次寫入衡量的,MLC閃存則是以數千次寫入衡量的,因為制程工藝朝著2X納米領域發展,也就是29納米到20納米之間的范圍。
對于數據重寫接近于零的歸檔場景來說,這無關緊要。
閃存成本正在下滑,有些人說閃存成本下滑的速度快于磁盤成本,重復數據刪除和壓縮可以進一步降低閃存成本。主數據閃存存儲系統可以利用重復數據刪除而避免影響數據訪問速度,而磁盤陣列并不會以相同的方式重新刪除冗余數據,因為這會延長訪問時間。
因此,高訪問率的主數據存儲正在從磁盤向閃存遷移。但是這并不適用于歸檔,因此在歸檔場景下,磁盤和閃存都可以使用重復數據刪除。
關于TLC閃存成本下滑率的推斷顯示,大約2017年它將在成本方面趕超SAS磁盤,下滑速度仍將快于磁盤,到2020年下探到更為廉價的SATA磁盤成本,在下個十年還不太可能與之匹敵。以下表格顯示了這個趨勢:

圖 2 隨著時間推移TLC閃存和SAS磁盤的價格變動
這張來自NetApp的圖表顯示了隨著時間推移TLC閃存和SAS磁盤的價格變動。兩條曲線與SATA磁盤價格改變曲線是相關的,后者隨著時間推移保持1.0的常態。
這里可以看到,TLC閃存的成本仍然高于磁盤,磁盤的成本仍然高于磁帶。因此TLC閃存不太可能取代磁帶作為一種歸檔介質。
宏圖愿景
Wikibon的顧問認為,閃存也許會被用于歸檔數據,但只是針對保存元數據的大型對象,批量數據仍然保存在磁帶中。他們將這種雙生技術理念稱為“Flape”。
“磁帶與閃存的結合,針對大型對象或者文件,將不僅提供更低的成本,而且性能也要高于基于磁盤的方法。”
“這種方法的關鍵,是將掩埋在磁帶盒中的元數據保存到一個閃存層中,它可以指向所需數據在磁帶中的位置。結合近線磁帶文件系統技術,我們相信這種方法將為合適的用例提供更好的商業價值。”

圖 3 Flape的硬件成本
一張來自Wikibon關于硬件成本的表格顯示,看一看10年累積硬件成本,純磁盤歸檔的成本是550萬美元,而純磁帶的成本僅為80萬美元。
磁盤加閃存的成本可以達到730萬美元,而閃存加磁帶也就是Flape的成本為260萬美元:Flape勝出,如果你需要高速數據訪問,和最低的每GB存儲成本。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.hanmeixuan.com/
本文標題:閃存數據存儲:讓磁帶從歸檔寶座上墜落