你知道什么是FLAPE?如果不知道,你可能已經(jīng)跟不上最新的歸檔技術(shù)發(fā)展。請看存儲專家Jon Toigo對于歸檔以及如何避免無意將垃圾信息歸檔保存是怎么說的。
數(shù)據(jù)歸檔的想法——將其放置在一個安全節(jié)能,合理組織的信息庫里,以備將來某一天的突然需要——聽起來夠直白了吧。然而即使是這樣一個簡單的想法也是充滿了問題,需要提前做好深思熟慮的。本文討論的一些決策可能會影響到你的歸檔項目的成敗。
在大多數(shù)關(guān)于歸檔的討論中的一個典型問題就是,數(shù)據(jù)的組織方式和格式是否經(jīng)得起時間的考驗。如果數(shù)據(jù)歸類的方式在以后需要發(fā)生改變,那怎么辦——例如,對某些類型數(shù)據(jù)管控和保留的規(guī)則發(fā)生了變化。或者用于創(chuàng)建某種數(shù)據(jù)的應(yīng)用程序不再被新的操作系統(tǒng)或硬件平臺支持,比方說10年后?難道在可預(yù)見的未來你都必須保留一份現(xiàn)有應(yīng)用程序和處理器的副本嗎?這些實際問題都需要簡單而有效的解決對策。
從數(shù)據(jù)歸檔方法的發(fā)展上思考這些問題的答案是有助益的。在過去,數(shù)據(jù)歸類并放入存檔是根據(jù)元數(shù)據(jù)(metadata),或數(shù)據(jù)的數(shù)據(jù)。一個數(shù)據(jù)集或文件,根據(jù)其元數(shù)據(jù),如果在30、60、90天或更長時間內(nèi)沒有被訪問到或修改,就會被簡單地遷移出生產(chǎn)系統(tǒng)的存儲空間,轉(zhuǎn)入歸檔存儲。然而,這種方法沒有任何粒度的區(qū)別。它完全不顧數(shù)據(jù)的重要性,與特定業(yè)務(wù)流程的相關(guān)性,或者與任何數(shù)據(jù)保留的法規(guī)法律的關(guān)聯(lián)性。所以這個過程有可能保存下來的有可能是垃圾文件,互聯(lián)網(wǎng)cookies和瀏覽器殘余,甚至是很久以前測試、開發(fā)過程中創(chuàng)建的臨時虛擬機的鏡像文件。
最起碼的一點是,除非你有一個“數(shù)據(jù)清潔”的程序到位,并幫助清除掉那些雜物,否則你的存檔系統(tǒng)注定會像你的主存儲系統(tǒng)一樣,在經(jīng)過一段時間后充滿了各種垃圾。這使得將來在存檔系統(tǒng)中搜索和使用有用信息更具挑戰(zhàn)。
對于無顆粒數(shù)據(jù)選擇的一種可選方案是基于誰創(chuàng)建它來進行分類。如果甲喬在會計部門工作,從喬甲的工作站中出來的所有數(shù)據(jù)都可以被作為“會計類數(shù)據(jù)”,并經(jīng)由為該類數(shù)據(jù)所制定的存檔策略進行處理。然而,這種做法也為以后留下了麻煩,例如,當甲喬的職位發(fā)生變化,從會計部門到銷售部門(對數(shù)據(jù)歸檔的策略完全不同),或者當甲喬喜歡上社交媒體,他在推特和博客中分享關(guān)于他的孩子和愛好的信息開始和他的合法工作文件一起存檔。你不得不再次面對存檔系統(tǒng)滿是垃圾,數(shù)據(jù)搜索使用很難的結(jié)果。
根據(jù)部門工作流程的數(shù)據(jù)分類
數(shù)據(jù)分類的最佳方式是把概念作為最大的粒度:按部門的工作流程創(chuàng)建數(shù)據(jù)分類,而不是按用戶角色來分類數(shù)據(jù)。然后在元數(shù)據(jù)中設(shè)置像“數(shù)據(jù)上次訪問時間”和“數(shù)據(jù)最后修改時間”這樣的觸發(fā)器,以確定何時將相關(guān)文件轉(zhuǎn)移到存檔系統(tǒng)。一些新興的分層存儲架構(gòu),如FLAPE(flash plus tape,閃存加磁帶),可以使你在把數(shù)據(jù)寫入主存儲系統(tǒng)(閃存,硬盤或兩者的組合)的同時就把數(shù)據(jù)也保存到歸檔系統(tǒng),這樣,你無需以后再次把數(shù)據(jù)移到歸檔系統(tǒng),而是保存在主存儲系統(tǒng)中的文件在達到其歸檔點后會被簡單地刪除。
作為一項規(guī)則,今天的歸檔管理員會盡量規(guī)避那些可能有“時限”的數(shù)據(jù)格式。文件系統(tǒng)看起來相當穩(wěn)定,但是用于存儲數(shù)據(jù)位的“容器”,要使得它們在離開了最初創(chuàng)建它們的原軟件后,依然能夠被使用——例如,有些商業(yè)文件格式,如Adobe PDF,或部分仍然處于試驗階段的“標準”XML容器——這依然是個問題。一家重要的國家檔案館幾年前選擇了Adobe PDF作為他們的數(shù)據(jù)容器,卻對此決定后悔不迭。因為Adobe在他們決定后的兩年就改變了PDF格式,他們?yōu)榇瞬坏貌粚γ恳粋數(shù)據(jù)進行“解”攝取,重新格式化,然后重新攝取的工作,花費了比以前多出30多倍的時間和工作量。
另一個挑戰(zhàn)則可能來自于早期對文件系統(tǒng)的穩(wěn)定性和永久性的假設(shè)。實際上,文件系統(tǒng)也一直在改變,新的文件系統(tǒng),被每一個今天流行的操作系統(tǒng)引入并利用,伴隨著新的功能特性,例如作為存儲方法一部分的重復(fù)數(shù)據(jù)刪除和壓縮,或作為數(shù)據(jù)保護方法的糾刪編碼。文件系統(tǒng)扁平化趨勢隨著網(wǎng)絡(luò)的發(fā)展有可能預(yù)示著傳統(tǒng)的分層或基于樹的文件系統(tǒng)模型將會在較短的時間內(nèi)被新的范式所取代,那時所有數(shù)據(jù)都以對象進行保存,在一個類數(shù)據(jù)庫的結(jié)構(gòu)中自描述或自索引。
對象存儲的歸檔
新的商業(yè)技術(shù),如Caringo Software的SWARM或Spectra Logic的Black Pearl,說明作為傳統(tǒng)存儲歸檔方法替代品的對象存儲市場正在孕育出真正成熟的解決方案。盡管如此,截止本文寫作之時市場上依然沒有占主導(dǎo)地位的架構(gòu)模式,而標準化的工作也還處于起步階段。假以時日,對象存儲和歸檔將會有很大的交疊。
將所有數(shù)據(jù)集作為對象對待的雙重優(yōu)點:
1.待存儲的數(shù)據(jù)集可以有大量豐富的元數(shù)據(jù),可以對數(shù)據(jù)對象進行更精確地識別和分類,進而可以把非常精細的策略應(yīng)用于數(shù)據(jù)的保持和維護。
2.整個存儲基礎(chǔ)設(shè)施和其上的數(shù)據(jù)可以被完整地進行管理,無需任何特殊軟件或設(shè)備提供數(shù)據(jù)保護或保存。這是因為數(shù)據(jù)保護的規(guī)則已經(jīng)被寫進了特定類型的所有數(shù)據(jù)對象的元數(shù)據(jù)中。
例如,Caringo的SWARM技術(shù),可以通過糾刪編碼將存儲數(shù)據(jù)的復(fù)制對象的各部分分散到整個存儲基礎(chǔ)設(shè)施中,并在其元數(shù)據(jù)中加入檢索標示。這樣,當某一存儲設(shè)備發(fā)生故障時,存儲對象依然能夠通過那些正常設(shè)備上存儲的部分來進行重建。而對于其他不需要這種保護功能的數(shù)據(jù)類型,可以把存儲對象的元數(shù)據(jù)句柄中簡單地設(shè)置成鏡像策略。這樣,數(shù)據(jù)的保障策略可以很容易地分配,使得存儲基礎(chǔ)設(shè)施成為歸檔和主存儲的一個通用平臺。
出現(xiàn)這種“歸檔就位”的策略,其中一個原因是可以推動大數(shù)據(jù)分析。另一個原因是存儲服務(wù)的成本被包含其中。而對于歸檔管理員,簡化日后數(shù)據(jù)歸類和保存的方法是其意義所在。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.hanmeixuan.com/
本文網(wǎng)址:http://m.hanmeixuan.com/html/support/11121517756.html